技術 2025年12月7日 約6分 【OCR】2025年のウェブ実装の限界と知見まとめ ブラウザOCR、サーバーOCR、クラウドAPI、AIまで。日本語OCRをウェブで実装しようとして得た知見と各手法の限界をまとめる OCR JavaScript Tesseract.js NDLOCR Transformers.js AI Docker Google Cloud Vision PaddleOCR 日本語OCR ブラウザ
技術 2025年12月1日 約3分 NDLOCRの段組認識問題をヒストグラム解析で力技解決 4段組縦書き書籍のOCRで、Layout Parserが使えずPyMuPDFとヒストグラム解析で段を切り出した話 NDLOCR OCR Python PyMuPDF
技術 2025年12月1日 約4分 NDLOCR Docker イメージビルドの成功手順まとめ NDLOCRのDockerイメージビルドでハマったポイントと解決策 Docker NDLOCR OCR Windows AI CUDA