総務省とNICT、多言語音声翻訳コンテストを開催。APIも開放 38
ストーリー by hylom
常識を超えるものは出てくるか 部門より
常識を超えるものは出てくるか 部門より
あるAnonymous Coward曰く、
総務省と情報通信研究機構(NICT)が「多言語音声翻訳アイデアコンテスト」を開催する(総務省の発表、コンテストのWebサイト)。
世界の「言葉の壁」をなくす新しいアイデアを募集するとともに、概念実証(Proof of Concept、PoC)コンテストも行われる。これに合わせて、NICTが開発した多言語音声翻訳機能を利用できるAPIも公開される。
公開されるAPIは音声認識API、機械翻訳API、音声合成APIで、NICTの翻訳アプリ(VoiceTra)相当の精度の機能が使える様子。
スラドの皆さんは、どんなアレゲな翻訳機を作るのだろうか。
感応翻訳機 (スコア:2)
Re: (スコア:0)
信心がたらんのとちゃいますか?
Re: (スコア:0)
煩悩翻訳機とか本能翻訳機とか
Re:感応翻訳機 (スコア:1)
官能翻訳機・・・
Re: (スコア:0)
音声翻訳だから必要ですよね。
笑いでも朗笑、失笑、冷笑、苦笑、嘲笑いろいろあるから
誤訳で争いに発展しそう。
Re: (スコア:0)
日本のOkの指サインをサムアップに変換するとか。
逆さに立てた箒を……ま何か適当に変換するとか。
Re: (スコア:0)
言語要らなくね、それ?
多分組み合わせ可能? (スコア:2)
とあるので、任意に使い分けができるのであれば、色々使い道がありそうです。Androidなら、音声認識はAndroid Speech Recognizerの方が精度がよければそっち使うとか。
ほえほえ
Re: (スコア:0)
未踏事業とは組めなかったのかな
Re:多分組み合わせ可能? (スコア:2)
広報活動が極めて弱いように思われますので、組む以前に知らないのだと思います。随分以前からあるサービス(VoiceTra)なんですけどね。ごく少数の民間業者と手を組んでるらしいですが。
ほえほえ
Re: (スコア:0)
手を組んだ民間業者の側ががんばって宣伝してるので、今後の知名度向上に期待。
ポケトークW、家族の海外旅行に持たせようかと検討中。
NICTの翻訳システム、どの言語もけっこう実用的に使えて便利。
ただ、中国語翻訳が簡体字ベースっぽくて、日本語←→繁体中文のときに簡体中文を経由するらしく、
繁体字の単語の処理がうまくいかないことがあるんだけど、今更修正は無理なんだろうな。
Re:多分組み合わせ可能? (スコア:1)
未踏はIPA=経産省、NICTは総務省なので、
まあ、組むって考えはないでしょう。
バベルの塔を建てたことを (スコア:1)
まあ、同じ日本語どうしなのに意思の疎通に問題がある人もいるようですが
Re: (スコア:0)
なんとなくもう一回バベルの塔を立てるチャンスをもらえたような気もします。
Re: (スコア:0)
そりゃ閣議決定で意味を変更されちゃうからな
ほんやくコンニャク (スコア:0)
だがAPIは役立たなさそうだ
中間言語 (スコア:0)
一度中間言語に変換して、そこからターゲットの言語に変換するタイプの翻訳はできないものだろうか
Re:中間言語 (スコア:4, 興味深い)
それは過去に何度も試みられていますが、特定の2言語間に特化した機械翻訳をどうしても越えられません。
ユニバーサルな中間言語(あるいは言語に依存しない意味表現と言ってもいいでしょうが)の設計は非常に困難ですし、たとえそのような中間言語が設計できたとしても、個別言語から中間言語への変換、また中間言語から個別言語への再変換にはまた別の大きな壁があります。
生成文法では、仮に中間言語が設計できたと仮定したとき、そこからどのように実際の言語への変換が行われるかを説明しようとしていますが、研究者間の共通認識を得るにはまだ遠い状況です。
Re: (スコア:0)
アレげで中間言語を採用するならクリンゴン語一択だなw
# 平和関係の語彙が全部なくなったりして?
Re: (スコア:0)
普通にあるでしょ
Re: (スコア:0)
エスペラント語よりボディーランゲージのほうが優れているような気がする
○○弁ジェネレーター (スコア:0)
……みたいなのを想像したけど、方言変換サイトってもうたくさんあるのね
Re: (スコア:0)
今の技術では方言認識はぜんぜんだめだ。だから親はSiriとか全く使い物にならない。
Re:○○弁ジェネレーター (スコア:2)
一応、VoiceTra [nict.go.jp]の”創作落語動画「VoiceTra for pick up」桂三四郎編”だと、関西弁はいけるようですよ
ほえほえ
「今すぐ使える スワヒリ語講座 Lesson.1」 (スコア:0)
これだったらとても実用的。
「・Kwa muda wa siku tatu, sijarudi. Nimeenda kouga kwenye dimbui la kijapani.
三日間帰っていないので、銭湯に行ってきます。
・Huyo si mdudu. Ni taratibu iliyotumiwa.
それはバグではなくて、仕様です。
・Ohh. Kama ni huyo purogurama, alitoroka jana.
ああ、そのプログラマなら昨日逃げました。
・Bejeti au pesa zote zilizokadiriwa zimekwisha.
予算は使い切りました。
・Itakuwa sawa nikirudi kesho?
今日は帰っても良いですか?
・Huyo mdudu amesababisha hasara kubwa sana.
このプログラムのバグは、致命的ですね。
・Nimeamura kuacha kazi.
わたしは、転職することにしました。」
https://sr [srad.jp]
犬←→日本語 (スコア:0)
お願いしたいワン。
Re: (スコア:0)
下僕の下僕に(好んで)なる奴はあと回しに決まってるだろ😾
Re: (スコア:0)
犬→人間 だけなら10年位前からあるんですが
あの“犬語”翻訳機が進化 「バウリンガルボイス」登場
http://www.itmedia.co.jp/lifestyle/articles/0907/08/news074.html [itmedia.co.jp]
今はスマホアプリになってる
http://bowlingual.net/index.html [bowlingual.net]
文脈ってどう認識してるの (スコア:0)
ICUが集中治療室だったり、国際基督教大学だったり
なんてのは他にもいろいろ有るだろうし。
Re: (スコア:0)
クラウド上のビッグデータを活用してコンテキストから統計的に判断します。
Re: (スコア:0)
コンテキストから文脈を認識???
Re: (スコア:0)
元となる辞書の入れ替えや出現率の多さで処理できるかと
それでも分からなければそのまま通せば良いし
形態素解析辺りだとそんな感じで処理してますよ
Re: (スコア:0)
グーグルマップの外国の地名の適当な翻訳を見れば、不完全で人に迷惑かけるだけのプログラムとデータしか作れていないことがよくわかる。
Re: (スコア:0)
逆でしょう。文脈から概念と関係性を特定していく。
「ICUに入る」だけじゃ区別付かないのは人間だって同じだし
マップの地名なんて文脈もヘッタクレもないから訳しようもないけど、
会話や文章というのは語を並べて意味を生み出すためのものなんだから
それなりの語彙構築と共起度解析で人間と同じように解釈することはできるよ。
教師が堅物だと「完全にAUTO」とか「95割」みたいなアホフレーズには対応できないだろうけど。
音声認識、機械翻訳、音声合成 の組み合わせだと (スコア:0)
話した言葉を翻訳して音として再生、というのを思い浮かべるけど、最終的には翻訳が一番足を引っ張りそう。
(某シンギュラリティ本にもちゃんとした翻訳は最高レベルに難しい、みたいに書かれていたと思う)
たとえ人間と同等レベル以上のAIができて、多言語と翻訳スキルをみっちり教え込ませたとしても
そもそも訳ができない言葉もあるだろうし、翻訳元の言語では省略されている要素を特定できないこともあるだろうし、
翻訳という手法だけではどうしようもない部分が出てくるように思う。
それを補おうとするなら注釈(訳注)をつける必要が出てくると思うが、
もとの話し手の言葉であるかのように音をつくるとすると、注釈とは相性が悪い。
そう考えると、最終的には 翻訳 というより、いろいろ解説してくれたり、不足した情報を発言者に質問したりする通訳者のような存在が必要なのではないかと思う。
同じ言語同士での言い換え (スコア:0)
自分「いつも『愛してる』ばかりじゃマンネリだから、良い感じに翻訳機に言い換えて貰おう」
自分「愛してる」→(翻訳機が翻訳)→「月がきれいですね」→(相手の翻訳機が翻訳)→「愛してる」→相手
意味が無かった・・・
Re: (スコア:0)
星新一のショートショートにそんな話があったような
みんな通訳のオウム型ロボットを型に乗せていて、セールスマンと客の会話が
客「いらないわ」
↓
客のオウム「大変魅力的なのですが主人と相談しないと決められないのでうんたらかんたら」
↓
セールスマンのオウム「買わないとさ」
みたいになるやつ
Q太郎 (スコア:0)
人間には「パケラッター」としか聞こえないO次郎が何を言っているのか、リアルタイムで的確な日本語に翻訳してしまう翻訳エンジンは、いま思えば凄い。
# OPの歌詞では「何もできないけど」とあるが、いろいろできるんだよね...