アカウント名:
パスワード:
ぜひグーグル先生には、片っ端から市場に出回ってる洋画 DVD を買い占めて頂いて、お得意の OCR 技術を用いてスポッティング情報を含めた巨大な英日字幕対訳コーパスを構築してほしい(なっち [wikipedia.org]の超訳はサンプルから要除外)。つか、そうでもしないと、少なくとも日本語字幕においては従来型の機械翻訳じゃマトモなモノはできないぞ。映像メディアはタイムクリティカルだから。
# 作るだけ作って、やりっ放しはいけないと思います!
> # 作るだけ作って、やりっ放しはいけないと思います!
やり逃げ上等だからβなんだってば、ってな冗談はさておき・・・
音声認識によるテキスト化、動画に対しての OCR でのテキスト化と、着々と色々なソースをテキストでもって検索できる範囲を拡げる方向に行ってますよね。
さらにうまいのは、そのテキストに不満を持ったユーザが無償で協力できるようにしていたりとか。
この動きを見ていると、それによって達成される音声認識や翻訳精度の向上については、期待してないんじゃないかという気がしてきます。むしろ、テキストでの検索に引っ掛かることだけに腐心してる。その結果として検索のキーとなる単語をうまく頂戴すれば、それで十分役に立つって割り切りがあるんじゃないかなぁ。
# この調子だと生の音声や画像をキーにした検索についても相当やってるんだろうなぁ。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
「毎々お世話になっております。仕様書を頂きたく。」「拝承」 -- ある会社の日常
グーグル先生ならきっとできるよ! (スコア:0)
ぜひグーグル先生には、片っ端から市場に出回ってる洋画 DVD を買い占めて頂いて、お得意の OCR 技術を用いてスポッティング情報を含めた巨大な英日字幕対訳コーパスを構築してほしい(なっち [wikipedia.org]の超訳はサンプルから要除外)。つか、そうでもしないと、少なくとも日本語字幕においては従来型の機械翻訳じゃマトモなモノはできないぞ。映像メディアはタイムクリティカルだから。
# 作るだけ作って、やりっ放しはいけないと思います!
Re:グーグル先生ならきっとできるよ! (スコア:1)
> # 作るだけ作って、やりっ放しはいけないと思います!
やり逃げ上等だからβなんだってば、ってな冗談はさておき・・・
音声認識によるテキスト化、動画に対しての OCR でのテキスト化と、着々と色々なソースをテキストでもって検索できる範囲を拡げる方向に行ってますよね。
さらにうまいのは、そのテキストに不満を持ったユーザが無償で協力できるようにしていたりとか。
この動きを見ていると、それによって達成される音声認識や翻訳精度の向上については、期待してないんじゃないかという気がしてきます。むしろ、テキストでの検索に引っ掛かることだけに腐心してる。その結果として検索のキーとなる単語をうまく頂戴すれば、それで十分役に立つって割り切りがあるんじゃないかなぁ。
# この調子だと生の音声や画像をキーにした検索についても相当やってるんだろうなぁ。