2026/01/02(金)2026-01-02

おめざめ

0930 まったりおめざめ。よく眠れた。

プログラムひとまず完成

夕方までかかって、プログラムひとまず完成。最後のスキャンも完了し処理待ち。明日の朝には終わっているはず。

反省点

今回はOCRもVLMに任せてLLMで処理する形にしたけれどやはりOCRはOCR専用のライブラリを使った方が精度が良さそう。近日Tesseractとか使った実装に修正をしたい。

また企業情報や主要プロダクトの情報もローカルLLMに任せる形にしたけれど、やはり最新情報を持っているWeb検索連携型のLLMを使う方が良さそう。極力ローカルで処理したい気持ちはあるけれど、最新情報を持っていないと意味がないケースも多いので、ここは割り切るべきかも?もしくは最新情報をサーフィンしてきて、その内容を元に要約・抽出する形にするのが良いのかも。