技術 2026年1月30日(金) 約4分 PaddleOCR-VL-1.5 — 0.9Bパラメータで文書解析SOTAを更新 Baiduが公開したPaddleOCR-VL-1.5は、わずか0.9Bのパラメータで文書解析ベンチマークOmniDocBench v1.5において94.5%の精度を達成。GPT-4oやQwen2.5-VL-72Bを上回るSOTA性能を記録した。 AI OCR VLM PaddlePaddle
技術 2026年1月20日(火) 約4分 VLMベースOCRの台頭 - DeepSeek-OCRとハイブリッド活用の可能性 従来のOCRとVLM(Vision Language Model)ベースOCRの違いを解説。DeepSeek-OCRの紹介と、両者を組み合わせたハイブリッド手法の可能性を考察する。 AI OCR DeepSeek VLM