アカウント名:
パスワード:
今年3月の記事 [itmedia.co.jp]では、東京五輪が開かれる2020年までに実用化を目指し実証実験を行うとしていましたが、その話ですね。
例として「具合の悪い方はいらっしゃいますか?」が用いられています。そこでの翻訳は "Is anyone sick?"です。
Googleだと "Do you have a bad condition is ?"Exciteだと "Is there a one in bad condition?"Yahoo・Weblio・Infoseekだと "Does the bad person come?"bingだと "Sick pe
最近のこの種のシステムはいわゆる「ビッグデータ」的な考え方で、大量に蓄積されたデータを参照しながら処理をしていて、短くても定型的な文例は真っ当な翻訳をしてくれるはず一方、GoogleやExciteだとかの多言語間の翻訳に対応したwebサービスはそういうことをせずに、単純な直訳的処理をしているだけなのでは?
汎用翻訳システムと専用翻訳システムの差かも。空港や駅で観光客相手の専用システムなら「気分の悪い方は~」とか「飛行機の到着時間が変更になりました」みたいなフレーズは最初から組み込んでおけばいいけど、汎用システムじゃそういう個別対応は切りがないからね。
>GoogleやExciteだとかの多言語間の翻訳に対応したwebサービスはそういうことをせずに、単純な直訳的処理をしているだけなのでは?「ジョジョの奇妙な冒険」とか「(とある科学の)超電磁砲」とかはキチンと訳してくれてたような?「聖
> #誤訳通知して、通知のあるものだけ個別対応かもしれんけど。たしかGoogle検索用のインデックス収集の応用で(Google日本語入力もだが)語彙を増やしてたはず。だから流行り言葉に強い、というか流行ってたら間違ってても収集してしまいがち、だったかなぁ?
ただ、Google翻訳は訂正を実行するとそれを向こうが学習するので、アニメ用語や意図的な誤訳を仕込むという悪質(?)な遊びが流行ったことがありました。その名残かアニメ用語は思わぬ所で顔をだすことがあるので要注意です。その記事のように。# その記事のネタは初めて知ったけどすげぇなコレ……
ちなみにExcite翻訳はGoogle翻訳より以前から結構ネタにされていましたね。当時の自動翻訳の酷さ(今でも微妙な奴が多いが)自体がネタなんですが、「shit」に付ける感嘆符の数でネタ翻訳する隠し機能が仕込まれていました。「糞!」→「脱糞してください!」→「脱糞します!」…エキサイトしすぎ。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
計算機科学者とは、壊れていないものを修理する人々のことである
2020年までに実用化を目指す (スコア:3, 参考になる)
今年3月の記事 [itmedia.co.jp]では、東京五輪が開かれる2020年までに実用化を目指し
実証実験を行うとしていましたが、その話ですね。
例として「具合の悪い方はいらっしゃいますか?」が用いられています。
そこでの翻訳は "Is anyone sick?"です。
Googleだと "Do you have a bad condition is ?"
Exciteだと "Is there a one in bad condition?"
Yahoo・Weblio・Infoseekだと "Does the bad person come?"
bingだと "Sick pe
Re: (スコア:0)
最近のこの種のシステムはいわゆる「ビッグデータ」的な考え方で、大量に蓄積されたデータを参照しながら処理をしていて、短くても定型的な文例は真っ当な翻訳をしてくれるはず
一方、GoogleやExciteだとかの多言語間の翻訳に対応したwebサービスはそういうことをせずに、単純な直訳的処理をしているだけなのでは?
Re: (スコア:0)
汎用翻訳システムと専用翻訳システムの差かも。
空港や駅で観光客相手の専用システムなら「気分の悪い方は~」とか「飛行機の到着時間が変更になりました」
みたいなフレーズは最初から組み込んでおけばいいけど、汎用システムじゃそういう個別対応は切りがないからね。
>GoogleやExciteだとかの多言語間の翻訳に対応したwebサービスはそういうことをせずに、単純な直訳的処理をしているだけなのでは?
「ジョジョの奇妙な冒険」とか「(とある科学の)超電磁砲」とかはキチンと訳してくれてたような?
「聖
Re:2020年までに実用化を目指す (スコア:0)
> #誤訳通知して、通知のあるものだけ個別対応かもしれんけど。
たしかGoogle検索用のインデックス収集の応用で(Google日本語入力もだが)語彙を増やしてたはず。
だから流行り言葉に強い、というか流行ってたら間違ってても収集してしまいがち、だったかなぁ?
ただ、Google翻訳は訂正を実行するとそれを向こうが学習するので、
アニメ用語や意図的な誤訳を仕込むという悪質(?)な遊びが流行ったことがありました。
その名残かアニメ用語は思わぬ所で顔をだすことがあるので要注意です。その記事のように。
# その記事のネタは初めて知ったけどすげぇなコレ……
ちなみにExcite翻訳はGoogle翻訳より以前から結構ネタにされていましたね。
当時の自動翻訳の酷さ(今でも微妙な奴が多いが)自体がネタなんですが、
「shit」に付ける感嘆符の数でネタ翻訳する隠し機能が仕込まれていました。
「糞!」→「脱糞してください!」→「脱糞します!」…エキサイトしすぎ。