技術 2026年2月28日(土) 約16分 エンコーダーモデル+ローカルLLMでOCR誤字を自動検出・修正する LUKE/BERTのfill-maskファインチューニングから始めて、perplexityベースの誤字検出→Qwen2.5 7Bでの修正判定→不一致時エスカレーションのパイプラインに至るまでの実験ログ。VRAM 8GBのRTX 4060 Laptopで完結する構成。 自然言語処理 OCR 機械学習 Python BERT LUKE ollama LLM WSL2 NDLOCR-Lite 実験
技術 2026年2月27日(金) 約8分 ScanSnap+NDLOCR-Liteで機密文書をローカルOCRするホットフォルダを作った ScanSnapで読み込んだ画像をフォルダ監視スクリプトで自動OCRし、LLM校正まで試した記録。エアギャップ環境でのセキュリティ設計も含む。 OCR NDLOCR-Lite ScanSnap Python Mac ローカルLLM 実験
技術 2026年2月27日(金) 約7分 NDLOCRを3か月やった記録と周辺の実装いろいろ Docker版で地獄を見てからLite+LLM校正まで。自分の試行錯誤と、NDLOCR-LiteをブラウザOCRにした人の実装を紹介する。 OCR NDLOCR NDLOCR-Lite Python Docker ローカルLLM ONNX WebAssembly 実験
技術 2026年2月26日(木) 更新 約13分 NDLOCR-Liteの読み取り結果をQwen3.5とSwallowで校正比較した NDLOCR-LiteのCLI版をApple Silicon Macにセットアップし、Qwen 3.5やSwallowでOCR結果を校正してみた記録。画像直読みやアンカリング効果など、いろいろ試した。 OCR Python NDLOCR-Lite Mac Qwen Swallow ollama ローカルLLM 実験
技術 2026年2月25日(水) 更新 約8分 国立国会図書館が作ったOCR「NDLOCR-Lite」をWindowsで動かしてみた 国立国会図書館が公開したGPU不要の軽量OCR「NDLOCR-Lite」をWindows 11にインストールしてCLI・GUIの両方で試した記録。 OCR Python NDLOCR-Lite 実験
技術 2026年2月19日(木) 約3分 Gradio 6のgr.HTMLで、Pythonファイル1つから完全なWebアプリが作れるようになった Gradio 6で追加されたgr.HTMLコンポーネントの仕組みと使い方を解説する。HTML・CSS・JavaScriptをPython内に記述し、ビルドなしでインタラクティブなWebアプリを構築できる。 Gradio Python Webアプリ AI
技術 2026年2月3日(火) 約3分 ACE-Step:ローカルで動く音楽生成AI基盤モデルを調べた 音楽版Stable Diffusionを目指すACE-Stepについて、M1 Maxで試す前の下調べとしてまとめた。アーキテクチャ、機能、インストール手順など。 AI 音楽生成 Apple Silicon Mac Python ローカルAI
技術 2026年2月3日(火) 約2分 Agent Lightning: MicrosoftのAIエージェント強化学習フレームワーク Microsoftが公開した、ほぼコード変更なしであらゆるAIエージェントを強化学習で最適化できるフレームワーク。LangChain、AutoGen、Claude Agent SDKなど任意のフレームワークに対応。 AI エージェント 強化学習 Python Microsoft
技術 2026年2月3日(火) 約3分 MarkItDown — MicrosoftのドキュメントをMarkdownに変換するPythonツール PDF、Word、Excel、PowerPointなど多様なファイル形式をMarkdownに変換するMicrosoft製ツール。LLMパイプラインとの統合やMCPサーバー対応も。 Python Markdown LLM MCP ドキュメント変換
技術 2026年2月1日(日) 約4分 PageIndex — ベクトル検索なしでLLM推論だけのツリーRAG チャンキングもベクトルDBも使わず、LLMの推論で文書の階層ツリーを構築するRAGシステム「PageIndex」を調べた。段組認識やOCRパイプラインとの接続も考察。 AI RAG LLM OCR Python
技術 2026年1月28日(水) 約4分 JAXA Earth API for Python - 衛星データを手軽に扱えるAPIを調べてみた JAXAが提供する地球観測衛星データAPIのPythonパッケージについて調べた。インストール方法、基本的な使い方、Claude Desktop連携まで。 Python JAXA 衛星データ API MCP
技術 2025年12月9日(火) 約4分 【生成AI】仕事でLLM / RAG導入するので空き時間でLoRA作ってみる2025(前編) 社内RAG構築のためにMac mini M4 Proを導入予定。仕様が固まるまでの空き時間でLoRA学習環境を構築する計画をまとめました。 AI LLM RAG LoRA Mac Apple Silicon Python ComfyUI Stable Diffusion 画像生成 実験