#Ollama

12 件の記事

技術 2026年4月23日(木) 約18分

open-notebookをDockerもクラウドAPIも使わずM1 Maxで動かしてqwen3.6:35bに自分の記事を読ませた

NotebookLMクローンのopen-notebookはデフォルトがDocker前提＋クラウドAPI前提。SurrealDBをネイティブで入れて4プロセスをtmuxで立ち上げ、Ollamaのqwen3.6:35bとbge-m3だけでRAGを回した。自分が今朝書いたQwen3.6比較記事を食わせたら、正しい数値で答えた。

AI LLM ローカルLLM Ollama Qwen Apple Silicon RAG OSS 実験

技術 2026年4月23日(木) 約12分

Qwen3.6-27B DenseとQwen3.6-35B-A3B MoEをM1 Maxで比べたらMLXがOllamaの2倍速だった

Qwen3.6-27BをOllama/MLX両方で試したらOllamaはVLプロジェクタ付きGGUFをロードできず、MLXでは11 tok/sで動いた。ついでに35B-A3BをMLXで動かしたらOllama GGUFの2倍速。BBSを両モデルに作らせて意図汲み取りの差も見た。

LLM ローカルLLM Qwen Ollama MLX Apple Silicon MoE 実験

技術 2026年4月21日(火) 更新約9分

Qwen3.6-35B-A3BをOllamaでM1 Max 64GBに流したら思考が13倍に膨らんだ

Ollama 0.20.6でQwen3.6-35B-A3Bを試した記録。Gated DeltaNet対応済みで生成速度はQwen3.5と同じ27 tok/s、ただし思考トークンは13倍。マルチターン・ペルソナ・NSFW三段階の挙動もまとめた。

LLM ローカルLLM Qwen Ollama Apple Silicon MoE 実験

技術 2026年4月15日(水) 約11分

LLMの安全フィルタの仕組みとabliteratedモデルの実態

LLMの安全性はRLHF・Constitutional AI・システムプロンプト・入出力フィルタの多層構造で成り立っている。クラウド各社の温度差、abliteratedとuncensoredの違い、ローカルLLMのデフォルト検閲レベルを整理した。

AI LLM ローカルLLM セキュリティ Gemini Claude Ollama

技術 2026年4月14日(火) 約14分

ローカルVision LLMでキャラ画像からRPGパラメータを抽出できるか試した

Gemma、Qwen2.5-VLなどのローカルVision LLMにキャラクターの立ち絵やドット絵を入力し、RPG風のステータスをJSON形式で返せるか実験した記録。

AI ローカルLLM VLM 画像認識 Ollama Gemma Qwen Apple Silicon 実験

技術 2026年3月31日(火) 約6分

OllamaがMLXバックエンドに移行、Apple Siliconでのローカル推論が劇的に高速化

Ollama 0.19がApple SiliconでのバックエンドをMLXに切り替え、プリフィル1810トークン/秒・デコード112トークン/秒を達成。NVFP4量子化サポートとキャッシュ改善も同時投入された。

Ollama MLX Apple Silicon LLM ローカルLLM 推論最適化

技術 2026年3月23日(月) 約14分

BERT+Qwen OCR校正パイプラインをPythonツールにした

BERT perplexityスキャン→LLM判定→エスカレーションの3段パイプラインを、Win/Mac/Linux対応のPythonツールにパッケージング。インストーラーがllama-serverとGGUFモデルまで自動で落としてくる。

自然言語処理 OCR 機械学習 Python BERT LLM llama.cpp Qwen NDLOCR-Lite Gradio Ollama 実験

技術 2026年3月1日(日) 約11分

Qwen 3.5がRadeon 8060Sで全滅した原因はAMDドライバだった

Qwen 3.5がROCm/Vulkanで動かない原因をCPU推論・llama-server・LM Studioで切り分けた結果、AMDドライバの更新で全て解決した。

AI LLM ローカルLLM AMD llama.cpp Ollama LM Studio 実験

技術 2026年2月28日(土) 更新約11分

abliteratedモデルをOllamaで動かそうとして全滅した話と、結局公式版で済んだ話

huihui-aiのQwen 3.5 abliteratedは全バリアントでゴミトークンを吐いて全滅。GLM-4.7-Flash abliteratedもテンプレート崩壊で使い物にならず、最終的に公式版+thinking無効が正解だった。

AI LLM Ollama ローカルLLM AMD LM Studio Vulkan ROCm 実験

技術 2026年2月28日(土) 約16分

エンコーダーモデル+ローカルLLMでOCR誤字を自動検出・修正する

LUKE/BERTのfill-maskファインチューニングから始めて、perplexityベースの誤字検出→Qwen2.5 7Bでの修正判定→不一致時エスカレーションのパイプラインに至るまでの実験ログ。VRAM 8GBのRTX 4060 Laptopで完結する構成。

自然言語処理 OCR 機械学習 Python BERT LUKE Ollama LLM WSL2 NDLOCR-Lite 実験

技術 2026年2月26日(木) 更新約13分

NDLOCR-Liteの読み取り結果をQwen3.5とSwallowで校正比較した

NDLOCR-LiteのCLI版をApple Silicon Macにセットアップし、Qwen 3.5やSwallowでOCR結果を校正してみた記録。画像直読みやアンカリング効果など、いろいろ試した。

OCR Python NDLOCR-Lite Mac Qwen Swallow ollama ローカルLLM 実験

技術 2025年12月9日(火) 約7分

【RAG】Mac mini M4 Pro + Difyで社内ヘルプデスクを構築する2025（前編）

Mac mini M4 ProとDifyを使った社内ヘルプデスクRAGシステムの構築計画。2025年版Difyの進化ポイントと、ローカルLLM運用のコツをまとめました。

AI LLM RAG Dify Mac Apple Silicon Ollama Docker