Google 翻訳の本当の仕組みは知りませんが、何となく Google 翻訳は言語間翻訳のメタ言語(仲介言語)として英語を使っているのだろうなと想像しています。で、英語は印欧語族の言語なので、類型論的には屈折語由来なのですが、現在は中国語と同型の孤立語になっていると言っても構わないような言語になっています。その結果、一度英語に翻訳すると元の言語の語彙が持っていた格や人称、数、時制等の情報が失われてしまい、情報が削ぎ落とされた英語から、翻訳先の言語に翻訳する時にはテキトーな人称や数、格、時制等を付加しなければならなくなり、とんでもない訳になってしまいます。
翻訳元となる言語しだいかも (スコア:0)
どこで読んだのだか、検証された内容だったのか忘れたのですが、Googleの翻訳アルゴリズムは日本語のような言語には向いていないとかなんとか。英語からの翻訳ならそこそこマシな翻訳になるのかも?
私が読んだ記事だか日記だかが古くて、現在のシステムは別物の可能性もあります。あいまいすぎてすみません。
「ホームページシステムでの翻訳言語」も「辞書登録による翻訳精度向上」とあり、機械翻訳の予感がします。
Re:翻訳元となる言語しだいかも (スコア:2)
例えば、日本語や朝鮮語、モンゴル語、トルコ語、ハンガリー語等の間の翻訳ならば、系統論的には親縁言語ではなくても類型論敵に同類の言語ですから、この中のいずれかの言語をメタ言語にして翻訳すれば、互いにはだいぶ使い物になる翻訳になる可能性はありますが、間に英語を噛ましてしまうとシッチャカメッチャカで使い物にならない翻訳になってしまいます。
Chrome のサイトの自動翻訳機能も同じエンジンを使っていると想像しますが、つい先日、ノルウェー語のサイトを読もうとすると、まず最初に日本語に翻訳されてしまいますが、これが全くの意味不明。ハンガリー語に訳しても珍紛漢紛。まともな文になってない。そこで英語にしてみたら、まぁ、それも酷い訳ではありましたが、何とか記事の主旨は理解できました。
と言うわけで、自動翻訳は現状ではほとんど使い物にならないし、メタ言語を英語に限定している以上、今後も印欧語族以外の言語への翻訳の精度の改善は見込めないと想像しています。(メタ言語を英語にした場合でも、その時、形態素的には明示されなくても、可能性のある全ての文法的特徴をメタ情報として内在させ、翻訳先の言語で文法的に可能性のある組み合わせを全て候補として挙げられるような仕組みを作れば、英語でも使い物になるとは思いますが。)