技術 2026年5月3日(日) 約9分 日本語プロンプトをOllamaで英訳してComfyUIとmfluxに投げるFastAPIラッパでAnima・WAI-IL・FLUX.2 KleinをまとめてWebUI化 ローカルにあるWAI-Anima・WAI-IL(SDXL)・FLUX.2 Klein 4Bの3エンジンを、日本語プロンプトのまま叩ける薄いFastAPIラッパで束ねる。翻訳はOllama (gemma3:12b)、ComfyUIはAPIで動的にワークフロー組み立て、FLUX.2はmflux CLIをsubprocess、Tailscale経由でiPhoneからも生成できるようにした。 AI 画像生成 ComfyUI FLUX Apple Silicon Mac Ollama FastAPI Tailscale 実験
技術 2026年5月2日(土) 約12分 VoteWise AIで見るNext.jsとGemini 2.5 Flashの選挙ガイドAI VoteWise AIは、選挙制度の説明を多言語チャット、音声、ストーリーモードに寄せたNext.js製の civic tech 実装。Gemini 2.5 Flashを政治・選挙文脈で使うときの設計上の注意点も整理する。 AI Gemini Next.js Firebase Google Cloud 設計
技術 2026年5月2日(土) 約22分 FastAPI・Chroma・Open WebUI・Ollamaでマルチモーダル日本語RAGをM1 Maxで組んだ DEV記事のPDF RAGをM1 Max 64GBで実装し、CLIPで画像、bge-m3 + Qwen3.6 35Bで日本語まで通した実験ログ。モダリティギャップ、推論サーバー並走クラッシュ、LLM-jp 4-8Bの指示追従失敗まで実機の挙動を記録。 AI LLM RAG ローカルLLM FastAPI llama.cpp Chroma Python Apple Silicon Ollama 日本語LLM 実験
技術 2026年5月2日(土) 更新 約11分 FastAPI・llama.cpp・Chroma・Open WebUIでPDF用ローカルRAGを組む記事を読んだ DEV Communityの記事をもとに、FastAPIでOpenAI互換RAG APIを作り、llama.cpp、Chroma、Open WebUIをつなぐ構成の位置づけと実装上の落とし穴を整理する。 AI LLM RAG ローカルLLM FastAPI llama.cpp Chroma Python Docker
技術 2026年5月2日(土) 約10分 かなチャット v3とブログ特化に寄せた話 正規CLIラッパー型AIエージェント「かなチャット」のv2からv3への変化。OpenClaw自前路線から後退して、AIニュース・論文の濁流を素早くドラフト化するブログパイプラインに寄せた経緯と現状。 AIエージェント Claude Code Codex OpenClaw Gemini tmux FastAPI Tailscale 自作ツール 実験
技術 2026年5月2日(土) 約13分 OCR-Memoryはエージェントの履歴を画像として思い出す arXiv:2604.26622のOCR-Memoryを読んだ。エージェントの長い実行履歴を画像化し、Set-of-Markで該当箇所だけ選ばせ、元ログから逐語テキストを戻すメモリ方式だ。 AI AIエージェント OCR VLM RAG トークン管理 論文
技術 2026年5月2日(土) 約19分 Qwen-ScopeのSAEをM1 Max 64GBで動かして日本語特徴を取り出す Qwen-ScopeのSparse AutoencoderをローカルのM1 Max 64GBで動かし、Qwen3-8B-Baseの中間層から日本語・英語・コード・中国語を弁別する特徴IDを取り出した記録。 AI LLM Qwen 解釈可能性 実験 Apple Silicon MPS
技術 2026年5月1日(金) 約14分 XLSXストリーミング書き込みで正確性とスループットを分ける Apache POIでOOXMLの骨格を作り、sheetDataだけを自前ストリーミングするハイブリッド手法。XLSXの互換性と大量セル書き込みの速度を別問題として扱う。 Java パフォーマンス アーキテクチャ 実験
技術 2026年5月1日(金) 約7分 円を斜めから見た楕円と作図用の楕円は同じではない 円を透視図で見たときにできる楕円、紙の上に直接描く楕円、楕円の長軸と円の中心のズレを、射影幾何の話として分けて見る。 数学 構図 数式 入門
技術 2026年5月1日(金) 更新 約11分 Qwen-ScopeはQwen内部特徴を推論制御やデータ合成に使うSAEスイート QwenチームがQwen3/Qwen3.5向けのSparse AutoencoderスイートQwen-Scopeを公開した。14グループのSAEで、推論時ステアリング、評価分析、毒性分類、データ合成、学習改善までを狙う。 AI LLM Qwen 解釈可能性 AIセーフティ
技術 2026年4月30日(木) 約7分 Rust/WASM製VecLiteでブラウザ内RAGの検索部分が現実味を帯びた VecLiteはRust/WASM+SIMDでブラウザ内ベクトル検索を高速化するライブラリ。Transformers.jsで埋め込みを作り、IndexedDBに保存し、サーバーなしでRAGを組むときにどこが詰まるかを整理する。 Rust WebAssembly RAG Embedding AI Coding
技術 2026年4月30日(木) 約8分 GPT-5.5に湧いたゴブリンをOpenAIがスレイした OpenAIがGPT-5.1以降で増えた特定の比喩表現について、人格カスタマイズ、報酬信号、SFTデータへの混入、Codexでの抑制まで調査結果を公開した。 OpenAI LLM Codex 強化学習 AI安全性