国会図書館の開発したOCRソフトがリリースされました|画像生成と会話するAIの魅力と可能性
https://note.com/chat_gpt777/n/n78dbdbdfa64f
以前古文書を読めるOCRとして「NDL古典籍OCR Lite Web版」が提供されていました。その姉妹版です。
「NDLOCR-Lite Web」という名前のOCRソフトです。これは古文書は解読は出来ません。明治時代の文献、図書以降、現代の本などをテキストに変換してくれます。精度はかなり良い。参考書などをカメラで撮影してこのOCRでテキスト化が出来ます。インストール不要。下記のURLにアクセスして、画像を入れれば使えます。
国会図書館の軽量AI-OCRツール「NDLOCR-Lite」が早速Webアプリに、ブラウザーさえあれば使える!
https://forest.watch.impress.co.jp/docs/serial/yajiuma/2089230.html
GPUなしで動作する軽量なAI OCRツール「NDLOCR-Lite」、国会図書館のラボから無償公開
https://forest.watch.impress.co.jp/docs/news/2088188.html
NDLOCR-Lite Web
https://ndlocr-liteweb.netlify.app/
NDL古典籍OCR Lite Web版
https://ndlkotenocr-lite-web.netlify.app/
古文書の解析、解読ソフト、画像の大きさを横4000ピクセル位の大きさにしておくと精度の良い変換が出来ると書いてある。また画像の色もグレースケールにと。今まで小さい画像を入れていたので、解読などが良くないと言っていた。もう少し調査が必要ですねえ。この条件は「NDLOCR-Lite Web」も同様ですね。
ダウンロードして自分のパソコンにインストールするタイプもあります。Web版は手軽です。




