声の日記|画像生成と会話するAIの魅力と可能性
https://note.com/chat_gpt777/n/n1d619366ee26
声で日記を書けるというチャレンジをしてみました。マイク又は録音音声ファイルを入力することで、音声の文字起こしをする仕組みを設けました。認識率はGeminiなんかに比べて劣りますが、キーボードで修正して使ってみてください。ブラウザだけで動作する仕組みですので、強力な音声認識エンジンは使えなかった。それなりに変換できるというものです。
音声をテキストに変換し、日記・忘備録・アイデアとして記録するブラウザアプリケーションです。 マイクによるリアルタイム認識と、録音ファイルのAI文字起こしを組み合わせた、 プライバシーを重視したローカル処理型の音声メモシステムです。
声を記録する、三つの方法
マイクリアルタイム認識
ブラウザ標準のWeb Speech APIを使い、話した言葉をリアルタイムで文字に変換します。確定テキストと未確定テキストを色分けして表示。
Chrome / Edge 専用
AIファイル文字起こし
録音済みの音声ファイル(MP3・WAV・M4A等)をブラウザ内で読み込み、Whisper AIが自動で文字起こし。マイクの許可は一切不要です。
全ブラウザ対応・マイク不要
キーボード直接入力
文字入力エリアに直接テキストを書き込めます。音声認識の結果を手動で修正・補足する際にも活用できます。
声の日記 v7
https://pasopia.velvet.jp/2026/soft/index025.html
声の日記 — ソフトウェア概要
https://pasopia.velvet.jp/2026/soft/voice_diary_overview.html
生成AIでソフトウェアを開発しよう(目標:1日1個のアプリの開発)
https://pasopia.velvet.jp/2026/soft/

