アカウント名:
パスワード:
今年3月の記事 [itmedia.co.jp]では、東京五輪が開かれる2020年までに実用化を目指し実証実験を行うとしていましたが、その話ですね。
例として「具合の悪い方はいらっしゃいますか?」が用いられています。そこでの翻訳は "Is anyone sick?"です。
Googleだと "Do you have a bad condition is ?"Exciteだと "Is there a one in bad condition?"Yahoo・Weblio・Infoseekだと "Does the bad person come?"bingだと "Sick people?"
機械的直訳が難しいらしく、結果に差が大きく出てきて興味深いですね。こういう難しい例をわざわざ用いられると、自信作なのかと期待してしまうのですがどうなのでしょう。
メガホンヤクやNaritraの元は、NICTが開発した翻訳エンジンでNICTのVoicetraの姉妹品ですね。関係者とお話したことがあるのですが、「比較性能は非常に良いんですが、普及しないんですよね。」とボヤかれてました。スマホアプリではなく、物にして配備しようというところに、普及に向けた試行錯誤が感じられます。
ウェブ翻訳サービスを提供したり、各種ブラウザに翻訳プラグインを提供したりというのも結構普及に貢献すると思うので、よろしく>NICT様
時に、Googleの翻訳や読み上げで使われる日本語音声合成は、非常にいらつく読み上げ方だと思うのは私だけだろうか。
ウェブ翻訳サービスを提供したり、各種ブラウザに翻訳プラグインを提供したり
想定されている内容に合致しているかどうかわかりませんが、みんなの自動翻訳@TexTra [jgn-x.jp]というのがございますので一度ご確認を。(エンジンはNICT製だった…はず)
そのサイトは研究用で、技術の実験や評価、データ収集のために作られていて、一般への普及などは目的としていないんじゃないのかな。「普及しないんですよね」とボヤくなら、普及を目的として設計されたサービスも必要ですよ>NICT様
まず、登録しないと一切機能が評価できないというのが、もうアカン。カスタマイズとか複雑で細々したオプションはメニューの下に押し込んでおいて、基本機能は「サイトに来たら、即、原文を入力してワンクリックだけで翻訳結果が得られる」ぐらいのシンプルなUIで利用できるものでなくては。
ところで、
自動翻訳エンジン 翻訳原文 具合の悪い方はいらっしゃいますか?
みんなの : Is there anyon
翻訳機に誤解されにくい文章の作り方をマスターできれば結構便利かも。それって結局、ある程度の語学力が要るんだけど。
まずは日本語と英語が出来る人用のデバイスとするのもありかな。自動翻訳を意識しつつ日本語で喋り、英語出力がこんがらがっていないことを確認できれば、入力は上手く認識された、と判断出来る。で、各国語に自動翻訳した多言語アナウンスが手軽に出来る、と言うような。
もう一段階、日本語→英語→日本語、と再翻訳させた文章が壊れてなければOK、とすれば、英語が出来ない人でも、妙な事をアナウンスすることは避けられる。国語のセンスが足りない人がそれをやろうとしても、延々と、珍文しか作れない事態に陥るけど。
と、考えていくと、自動車のオートマ免許のように、「機械アシストで多言語を自在に操れる能力」という落としどころを最初から目指すのも有りに思えてくる。中学・高校と、どうせ身につかない英語を勉強させるんだったら、最初から、自動翻訳を前提に、自動翻訳機にスムーズに認識されるような日本語をしゃべれるようにだけ勉強させる。それも、英作文の能力を裏付ける重要なスキルなわけで、語学を勉強する大きな理由の一つだし。
あ、でもダメか。相手が似たような能力を持ってないと、相手が言ってることが分からない事態に陥る。
最近のこの種のシステムはいわゆる「ビッグデータ」的な考え方で、大量に蓄積されたデータを参照しながら処理をしていて、短くても定型的な文例は真っ当な翻訳をしてくれるはず一方、GoogleやExciteだとかの多言語間の翻訳に対応したwebサービスはそういうことをせずに、単純な直訳的処理をしているだけなのでは?
汎用翻訳システムと専用翻訳システムの差かも。空港や駅で観光客相手の専用システムなら「気分の悪い方は~」とか「飛行機の到着時間が変更になりました」みたいなフレーズは最初から組み込んでおけばいいけど、汎用システムじゃそういう個別対応は切りがないからね。
>GoogleやExciteだとかの多言語間の翻訳に対応したwebサービスはそういうことをせずに、単純な直訳的処理をしているだけなのでは?「ジョジョの奇妙な冒険」とか「(とある科学の)超電磁砲」とかはキチンと訳してくれてたような?「聖
> #誤訳通知して、通知のあるものだけ個別対応かもしれんけど。たしかGoogle検索用のインデックス収集の応用で(Google日本語入力もだが)語彙を増やしてたはず。だから流行り言葉に強い、というか流行ってたら間違ってても収集してしまいがち、だったかなぁ?
ただ、Google翻訳は訂正を実行するとそれを向こうが学習するので、アニメ用語や意図的な誤訳を仕込むという悪質(?)な遊びが流行ったことがありました。その名残かアニメ用語は思わぬ所で顔をだすことがあるので要注意です。その記事のように。# その記事のネタは初めて知ったけどすげぇなコレ……
ちなみにExcite翻訳はGoogle翻訳より以前から結構ネタにされていましたね。当時の自動翻訳の酷さ(今でも微妙な奴が多いが)自体がネタなんですが、「shit」に付ける感嘆符の数でネタ翻訳する隠し機能が仕込まれていました。「糞!」→「脱糞してください!」→「脱糞します!」…エキサイトしすぎ。
○○五輪までに自動通訳機能の実用化を
と聞かされ続けてはや幾星霜・・・・・
#私の記憶が確かならば、私が最初にそれを聞いたのはバルセロナ五輪の数年前だった。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
あつくて寝られない時はhackしろ! 386BSD(98)はそうやってつくられましたよ? -- あるハッカー
2020年までに実用化を目指す (スコア:3, 参考になる)
今年3月の記事 [itmedia.co.jp]では、東京五輪が開かれる2020年までに実用化を目指し
実証実験を行うとしていましたが、その話ですね。
例として「具合の悪い方はいらっしゃいますか?」が用いられています。
そこでの翻訳は "Is anyone sick?"です。
Googleだと "Do you have a bad condition is ?"
Exciteだと "Is there a one in bad condition?"
Yahoo・Weblio・Infoseekだと "Does the bad person come?"
bingだと "Sick people?"
機械的直訳が難しいらしく、結果に差が大きく出てきて興味深いですね。
こういう難しい例をわざわざ用いられると、自信作なのかと
期待してしまうのですがどうなのでしょう。
Re:2020年までに実用化を目指す (スコア:3, 興味深い)
メガホンヤクやNaritraの元は、NICTが開発した翻訳エンジンでNICTのVoicetraの姉妹品ですね。
関係者とお話したことがあるのですが、「比較性能は非常に良いんですが、普及しないんですよね。」とボヤかれてました。
スマホアプリではなく、物にして配備しようというところに、普及に向けた試行錯誤が感じられます。
Re: (スコア:0)
ウェブ翻訳サービスを提供したり、各種ブラウザに翻訳プラグインを提供したりというのも
結構普及に貢献すると思うので、よろしく>NICT様
時に、Googleの翻訳や読み上げで使われる日本語音声合成は、非常にいらつく読み上げ方だと思うのは
私だけだろうか。
Re:2020年までに実用化を目指す (スコア:4, 興味深い)
想定されている内容に合致しているかどうかわかりませんが、みんなの自動翻訳@TexTra [jgn-x.jp]というのがございますので一度ご確認を。(エンジンはNICT製だった…はず)
ほえほえ
Re: (スコア:0)
そのサイトは研究用で、技術の実験や評価、データ収集のために作られていて、
一般への普及などは目的としていないんじゃないのかな。
「普及しないんですよね」とボヤくなら、普及を目的として設計されたサービスも必要ですよ>NICT様
まず、登録しないと一切機能が評価できないというのが、もうアカン。
カスタマイズとか複雑で細々したオプションはメニューの下に押し込んでおいて、
基本機能は「サイトに来たら、即、原文を入力してワンクリックだけで翻訳結果が得られる」
ぐらいのシンプルなUIで利用できるものでなくては。
ところで、
自動翻訳エンジン 翻訳
原文 具合の悪い方はいらっしゃいますか?
みんなの : Is there anyon
Re:2020年までに実用化を目指す (スコア:1)
翻訳機に誤解されにくい文章の作り方をマスターできれば結構便利かも。
それって結局、ある程度の語学力が要るんだけど。
まずは日本語と英語が出来る人用のデバイスとするのもありかな。
自動翻訳を意識しつつ日本語で喋り、英語出力がこんがらがっていないことを確認できれば、入力は上手く認識された、と判断出来る。
で、各国語に自動翻訳した多言語アナウンスが手軽に出来る、と言うような。
もう一段階、日本語→英語→日本語、と再翻訳させた文章が壊れてなければOK、とすれば、
英語が出来ない人でも、妙な事をアナウンスすることは避けられる。
国語のセンスが足りない人がそれをやろうとしても、延々と、珍文しか作れない事態に陥るけど。
と、考えていくと、自動車のオートマ免許のように、
「機械アシストで多言語を自在に操れる能力」という落としどころを最初から目指すのも有りに思えてくる。
中学・高校と、どうせ身につかない英語を勉強させるんだったら、最初から、自動翻訳を前提に、
自動翻訳機にスムーズに認識されるような日本語をしゃべれるようにだけ勉強させる。
それも、英作文の能力を裏付ける重要なスキルなわけで、語学を勉強する大きな理由の一つだし。
あ、でもダメか。相手が似たような能力を持ってないと、相手が言ってることが分からない事態に陥る。
Re: (スコア:0)
最近のこの種のシステムはいわゆる「ビッグデータ」的な考え方で、大量に蓄積されたデータを参照しながら処理をしていて、短くても定型的な文例は真っ当な翻訳をしてくれるはず
一方、GoogleやExciteだとかの多言語間の翻訳に対応したwebサービスはそういうことをせずに、単純な直訳的処理をしているだけなのでは?
Re: (スコア:0)
汎用翻訳システムと専用翻訳システムの差かも。
空港や駅で観光客相手の専用システムなら「気分の悪い方は~」とか「飛行機の到着時間が変更になりました」
みたいなフレーズは最初から組み込んでおけばいいけど、汎用システムじゃそういう個別対応は切りがないからね。
>GoogleやExciteだとかの多言語間の翻訳に対応したwebサービスはそういうことをせずに、単純な直訳的処理をしているだけなのでは?
「ジョジョの奇妙な冒険」とか「(とある科学の)超電磁砲」とかはキチンと訳してくれてたような?
「聖
Re: (スコア:0)
> #誤訳通知して、通知のあるものだけ個別対応かもしれんけど。
たしかGoogle検索用のインデックス収集の応用で(Google日本語入力もだが)語彙を増やしてたはず。
だから流行り言葉に強い、というか流行ってたら間違ってても収集してしまいがち、だったかなぁ?
ただ、Google翻訳は訂正を実行するとそれを向こうが学習するので、
アニメ用語や意図的な誤訳を仕込むという悪質(?)な遊びが流行ったことがありました。
その名残かアニメ用語は思わぬ所で顔をだすことがあるので要注意です。その記事のように。
# その記事のネタは初めて知ったけどすげぇなコレ……
ちなみにExcite翻訳はGoogle翻訳より以前から結構ネタにされていましたね。
当時の自動翻訳の酷さ(今でも微妙な奴が多いが)自体がネタなんですが、
「shit」に付ける感嘆符の数でネタ翻訳する隠し機能が仕込まれていました。
「糞!」→「脱糞してください!」→「脱糞します!」…エキサイトしすぎ。
自動通訳は4年ごとの「やるやる詐欺」の常習犯です。 (スコア:0)
○○五輪までに自動通訳機能の実用化を
と聞かされ続けてはや幾星霜・・・・・
#私の記憶が確かならば、私が最初にそれを聞いたのはバルセロナ五輪の数年前だった。