つみかさね

一球一球のつみかさね 一打一打のつみかさね 一歩一歩のつみかさね 一坐一坐のつみかさね 一作一作のつみかさね 一念一念のつみかさね

NDL古典籍OCR-Liteの使い方

NDL古典籍OCR-Liteの使い方|画像生成と会話するAIの魅力と可能性
https://note.com/chat_gpt777/n/n2cccafaf8e6f

これは古文書の画像を準備し、AI技術を用いて文字を認識・翻刻する無料のソフトウェアです。
NDL古典籍OCR-Liteは、ノートパソコン等の一般的な家庭用コンピュータやOS環境で、江戸期以前の和古書、清代以前の漢籍といった古典籍資料のデジタル化画像からテキストデータが作成できる軽量なOCRです。
GPU(Graphics Processing Unit。画像描画等の高度な並列計算を処理する装置。)がなくとも軽量なOCR処理が可能となりました

インストールしてみよう。
下記URLで
Windows版アプリ(外部リンク)をクリックすると「ndlkotenocr-lite_v1.0.0_windows.zip」がダウンロードできる。これを解凍するとWindowsというフォルダに一式入ったものが出来る。適当なフォルダ(tool等)にコピーする。例えばc:\tool\Windowsとその中に下記のファイルがあるので
ndlkotenocr_lite.exeを選択して、右クリック「送る」→「ディスクトップ(ショートカット作成)」をクリックして、起動用のショートカットを作成する。これでインストールは終わりです。

NDL古典籍OCR-Liteの使い方
起動用のショートカットをダブルクリックして「NDL古典籍OCR-Lite」を起動します。
「画像ファイルを処理する」を押して該当の古文書画像を選択する。次に出力先フォルダを選択する。(なければ作成する)
これで準備OKです。OCRボタンを押すと少し待たされる、数秒で釈文を出力してくれる。それを選択して、コピーしてエディタ等で保存する。これだけでOKです。何枚でも訳してくれますので使ってみてください。

また、出来上がった釈文をChatgpt等で読み下し文にしてもらう。また意味を現代語で教えてもらう等すると内容の理解に便利です。たくさんの文章を入れると、Chatgptが作成した物語を語ることがあるので注意が必要です。釈文は8割以上は正しい釈文になっているので、読み下し、現代語訳もそれなりのレベルにはなっていると思います。古文書の概要をしるには便利です。そしてもっと興味を持ったらもう少し詳細に自分で読むことになりますね。現代の日本人できちんとくずし字が読める人は全人口の0.01%程度と推定されており、有名作品を除けば翻刻はあまり進んでいないのが現状です。

NDL古典籍OCR-Liteの公開について
https://lab.ndl.go.jp/news/2024/2024-11-26/

NDL古典籍OCR-Liteの使い方

NDL古典籍OCR-Liteの使い方

NDL古典籍OCR-Liteの使い方

NDL古典籍OCR-Liteの使い方