「中国は日本を侵略した」が Japan invaded China. になるというやつですか? 確かGoogle翻訳は文法的な解析などをあまりやらず、膨大な言語資料から力任せに統計処理する(それでそこそこ翻訳が上手く入ってしまう)タイプとして有名ではなかったでしょうか。 Japan, China, invaded の順列として Japan invaded China という3 gramの頻度が圧倒的に高ければ(そして実際高いだろうと思います)、文法を無視してそれが選ばれてしまうような感じではないですかね。 今、Google翻訳で「車が私を運転する。」を英訳してみたら I drive a car. になりました。
In Soviet Russia (スコア:1)
「中国は日本を侵略した」が Japan invaded China. になるというやつですか?
確かGoogle翻訳は文法的な解析などをあまりやらず、膨大な言語資料から力任せに統計処理する(それでそこそこ翻訳が上手く入ってしまう)タイプとして有名ではなかったでしょうか。
Japan, China, invaded の順列として Japan invaded China という3 gramの頻度が圧倒的に高ければ(そして実際高いだろうと思います)、文法を無視してそれが選ばれてしまうような感じではないですかね。
今、Google翻訳で「車が私を運転する。」を英訳してみたら I drive a car. になりました。
中国語の「中国は日本を侵略した」を日本語に訳すと (スコア:1)
「中国は日本を侵略した」を自動認識させると、中国語になっています。中国語を使う方々がたくさん入力しているようですね。
試しにそのまま日本語に訳させると、「日本は中国を侵略したの」とちょっとかわいくなります。