技術 2026年5月7日(木) 約9分 人間とLLMの共著テキスト境界を変化点検出で切るarXiv論文を読んで最小実装を試した arXiv:2605.03723の人間・LLM共著テキスト分割手法をM1 MaxとQwen3-8B-Baseで動かした。重み付きCUSUMは標準Pythonで動くが、生log-likelihoodだと人間文単独でも境界が量産される。 AI LLM AIセーフティ 論文 Python 実験 Qwen
技術 2026年5月6日(水) 約13分 LLMを温かみのある応答にチューニングしても協調的ペルソナを与えてもユーザーの誤った意見に同意しやすくなるという2論文 Oxford Internet Institute(Nature 2026採録)の温かさファインチューニング実験と、Shahら arXiv 2604.10733の275ペルソナ協調性実験を並べる。ファインチューニングでもペルソナでも、ユーザーの感情や誤信念を入れると同じ方向にモデルが倒れる。 AI LLM AIセーフティ 論文紹介 OpenAI
技術 2026年5月6日(水) 更新 約9分 Gemma 4のMTP drafterで最大3倍高速化、ただし26B MoEはbatch 1で伸びにくい Google公式のGemma 4 MTP drafter公開を読む。最大3倍高速化の仕組み、vLLMの推奨設定、26B A4Bがbatch 1で伸びにくい理由まで確認した。 AI LLM Google Gemma ローカルLLM 推論
技術 2026年5月5日(火) 約9分 OllamaとローカルLLMでMCPサーバーを使うならブリッジが要る M1 Max 64GBでOllama経由のローカルLLMにMCPサーバーをつなぐと、MCPHostの非メンテ化、tool calling精度、コンテキスト消費で詰まる。公式SDKでの自作サーバー最小構成も載せた。 Ollama MCP ローカルLLM LLM AIエージェント
技術 2026年5月5日(火) 約13分 LLM向けTool-use APIは終了条件と再試行不可を返す設計にする Claude Codeの1.67Bトークン事故を起点に、ツール結果にis_complete・retryable・予算上限を返すとなぜ無限ループが止まるかを掘り下げた。MCPサーバー設計にも直結する。 AI LLM AIエージェント API Claude Code MCP
技術 2026年5月4日(月) 約12分 ファインチューニングでLLMの著作物丸暗記が再発火するというarXiv論文 GPT-4o、Gemini 2.5 Pro、DeepSeek-V3.1を対象に、要約から全文展開するファインチューニングで著作権書籍の逐語再現が増えると報告したarXiv論文を読んだ。 AI LLM 著作権 OpenAI Gemini DeepSeek ファインチューニング 論文
技術 2026年5月2日(土) 約22分 FastAPI・Chroma・Open WebUI・Ollamaでマルチモーダル日本語RAGをM1 Maxで組んだ DEV記事のPDF RAGをM1 Max 64GBで実装し、CLIPで画像、bge-m3 + Qwen3.6 35Bで日本語まで通した実験ログ。モダリティギャップ、推論サーバー並走クラッシュ、LLM-jp 4-8Bの指示追従失敗まで実機の挙動を記録。 AI LLM RAG ローカルLLM FastAPI llama.cpp Chroma Python Apple Silicon Ollama 日本語LLM 実験
技術 2026年5月2日(土) 更新 約11分 FastAPI・llama.cpp・Chroma・Open WebUIでPDF用ローカルRAGを組む記事を読んだ DEV Communityの記事をもとに、FastAPIでOpenAI互換RAG APIを作り、llama.cpp、Chroma、Open WebUIをつなぐ構成の位置づけと実装上の落とし穴を整理する。 AI LLM RAG ローカルLLM FastAPI llama.cpp Chroma Python Docker
技術 2026年5月2日(土) 約19分 Qwen-ScopeのSAEをM1 Max 64GBで動かして日本語特徴を取り出す Qwen-ScopeのSparse AutoencoderをローカルのM1 Max 64GBで動かし、Qwen3-8B-Baseの中間層から日本語・英語・コード・中国語を弁別する特徴IDを取り出した記録。 AI LLM Qwen 解釈可能性 実験 Apple Silicon MPS
技術 2026年5月1日(金) 更新 約11分 Qwen-ScopeはQwen内部特徴を推論制御やデータ合成に使うSAEスイート QwenチームがQwen3/Qwen3.5向けのSparse AutoencoderスイートQwen-Scopeを公開した。14グループのSAEで、推論時ステアリング、評価分析、毒性分類、データ合成、学習改善までを狙う。 AI LLM Qwen 解釈可能性 AIセーフティ
技術 2026年4月30日(木) 約8分 GPT-5.5に湧いたゴブリンをOpenAIがスレイした OpenAIがGPT-5.1以降で増えた特定の比喩表現について、人格カスタマイズ、報酬信号、SFTデータへの混入、Codexでの抑制まで調査結果を公開した。 OpenAI LLM Codex 強化学習 AI安全性
技術 2026年4月30日(木) 更新 約9分 NIIの48,000時間音声音響データセットはTTSの材料になる NII/LLMCが公開したCC AudioとArchive.org Audio Datasetを、URLリスト、メタデータ、TTS学習、Embedding解析の違いから読む。 AI 音声AI 音声合成 音声認識 TTS STT LLM 機械学習