ニコニコ動画やYouTubeの音声をテキスト化する「PodCastle」 15
ストーリー by headless
認識 部門より
認識 部門より
あるAnonymous Coward 曰く、
産総研は、インターネット上の動画音声データを対象とした音声全文検索・書き起こしサービス「PodCastle」を一般公開し、音声情報検索技術の実証実験を開始した(プレスリリース)。
音声認識技術によって動画音声データをテキスト化し、誤りをユーザーに訂正してもらうことで認識結果だけでなく認識精度も向上していくというもの。産総研では2008年から日本語のポッドキャストを対象とした音声全文検索サービスを公開し、ユーザーの協力により認識精度が向上することを実証していた。今回はポッドキャストに加えてニコニコ動画、YouTube、Ustreamに対応し、日本語と英語の音声認識および検索が可能となっている。
実際の認識例を見ると、報道系などについては比較的精度良くテキスト化できているが、トーク番組などのバラエティ系はあまり精度が高くないように見受けられる。ユーザーの訂正により、認識精度はどれぐらい向上するのだろうか。