技術 2026年3月23日(月) 約14分 BERT+Qwen OCR校正パイプラインをPythonツールにした BERT perplexityスキャン→LLM判定→エスカレーションの3段パイプラインを、Win/Mac/Linux対応のPythonツールにパッケージング。インストーラーがllama-serverとGGUFモデルまで自動で落としてくる。 自然言語処理 OCR 機械学習 Python BERT LLM llama.cpp Qwen NDLOCR-Lite Gradio Ollama 実験
技術 2026年3月9日(月) 約7分 NDLOCR-LiteをiOSネイティブアプリに載せてスマホOCRする NDLOCR-LiteのDEIMv2+PARSeqをONNX Runtime MobileでiOSアプリに同梱し、カメラ撮影→台形補正→レイアウト検出→文字認識→信頼度ベース校正をオンデバイスで完結させる。 OCR NDLOCR-Lite iOS Swift ONNX Runtime モバイル開発 実験
技術 2026年2月28日(土) 約16分 エンコーダーモデル+ローカルLLMでOCR誤字を自動検出・修正する LUKE/BERTのfill-maskファインチューニングから始めて、perplexityベースの誤字検出→Qwen2.5 7Bでの修正判定→不一致時エスカレーションのパイプラインに至るまでの実験ログ。VRAM 8GBのRTX 4060 Laptopで完結する構成。 自然言語処理 OCR 機械学習 Python BERT LUKE Ollama LLM WSL2 NDLOCR-Lite 実験
技術 2026年2月27日(金) 約8分 ScanSnap+NDLOCR-Liteで機密文書をローカルOCRするホットフォルダを作った ScanSnapで読み込んだ画像をフォルダ監視スクリプトで自動OCRし、LLM校正まで試した記録。エアギャップ環境でのセキュリティ設計も含む。 OCR NDLOCR-Lite ScanSnap Python Mac ローカルLLM 実験
技術 2026年2月27日(金) 約7分 NDLOCRを3か月やった記録と周辺の実装いろいろ Docker版で地獄を見てからLite+LLM校正まで。自分の試行錯誤と、NDLOCR-LiteをブラウザOCRにした人の実装を紹介する。 OCR NDLOCR NDLOCR-Lite Python Docker ローカルLLM ONNX WebAssembly 実験
技術 2026年2月26日(木) 更新 約13分 NDLOCR-Liteの読み取り結果をQwen3.5とSwallowで校正比較した NDLOCR-LiteのCLI版をApple Silicon Macにセットアップし、Qwen 3.5やSwallowでOCR結果を校正してみた記録。画像直読みやアンカリング効果など、いろいろ試した。 OCR Python NDLOCR-Lite Mac Qwen Swallow ollama ローカルLLM 実験
技術 2026年2月25日(水) 更新 約8分 国立国会図書館が作ったOCR「NDLOCR-Lite」をWindowsで動かしてみた 国立国会図書館が公開したGPU不要の軽量OCR「NDLOCR-Lite」をWindows 11にインストールしてCLI・GUIの両方で試した記録。 OCR Python NDLOCR-Lite 実験