パスワードを忘れた? アカウント作成
12602775 story
日本

台東区のホームページ、機械翻訳を使って89の外国語に対応。うち81言語はGoogle翻訳 52

ストーリー by hylom
機械翻訳を公式とするのはどうなのよ 部門より
maia 曰く、

東京都台東区が11月30日の夜間に公式サイトをリニューアルし、89の外国語に対応した(プレスリリース)。ただし、「この翻訳は、プログラムを用いて機械的に行われますので、内容が正確であるとは限りません」との注釈も付いている。

リニューアル前は英語および中国語(簡体字)、韓国語の3か国語のみの対応だったが、リニューアル後は「ホームページシステムでの翻訳」で中国語(繁体字)およびフランス語、タイ語、マレー語、インドネシア語に対応。これらは「辞書登録による翻訳精度向上、画像の翻訳にも対応」しているという。また、残りの81言語はグーグルの翻訳システムを使うという。

いやしかし、翻訳不可能性ないし翻訳の不確定性という命題を考えた方がいいのではなかろうか。まして、会話ではなく、静的な文章である。翻訳結果に責任を持てるよう、それぞれの言語に精通した人材がチェックした方がよいと思われるし、そうなると、ほんの僅かな言語数対応か、翻訳対応のコンテンツ(ページ)を限定しておくのが限界だと思う。老婆心ながら。

なお、2012年には東北観光博外国語版ウェブサイト、自動翻訳による誤訳のため一時閉鎖という時間も起きている。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • それ MSDN Library にも言ってあげてください。
    例えばこういうの
    https://msdn.microsoft.com/ja-jp/library/office/ff845670.aspx [microsoft.com]

    --
    uxi
    • by Anonymous Coward on 2015年12月01日 16時59分 (#2926544)

      先を越された!

      ってのはともかく、MSDNは訳がおかしかったら原典を見ることができる人だけが読む前提なので、そうでない人が読む役所の広報はちょっと違うと思う。(ので、MSDNは放置でよいがこれはまずい)

      親コメント
      • by Anonymous Coward on 2015年12月01日 18時30分 (#2926602)
        というかリンクで挙げられてる箇所はそれほど意味不明じゃないよね。断続的な絞首刑とかに比べたら全然マシ。
        # 自社製品の他国語リソースで翻訳した分が、機械翻訳の辞書に反映されてないのは相変わらずアホだと思うけど。
        親コメント
      • by Anonymous Coward

        でもまずい、と言っても人でも金も無いよ(だから無料のgoogle翻訳を使っている)。あまり正確でない翻訳を載せるかタレこみ文にあるように少数の正しい翻訳文のみ載せるか。

        • そこでボランティア(ここでは「タダで使える外国人」の意)の活用ですよ。
          以前ある自治体のサイトを見たら、外国語のページに、海外からの留学生によって
          翻訳された旨が記されていました。とりあえずオリンピックを錦の御旗にすれば
          いいんじゃないでしょうかね。

          親コメント
          • by Anonymous Coward on 2015年12月01日 20時40分 (#2926693)

            外国人です。こういうボランティア活動は家でも出来るのか特徴で、もっと増えてほしいです。

            # 履歴書にも書けるから

            親コメント
          • もうちょっとラフに、間違ってたら教えてねとか考えてみた.でも、ふと思ったんだけど、意図的によろしくない訳というか、全然関係なく例えばfxxk混ぜられるとかされたら、チェックアウトできないよなぁ.そうするとちゃんとボランティア登録のような形にしないとダメそうです.
            親コメント
          • by Anonymous Coward

            タダで使える外国人(ここでは「奴隷」の意)

      • by Anonymous Coward

        俺もそう思ってたんだけど、
        きのうMicrosoft Solitaireで遊んだら
        ルール説明が見事に意味不明で、ああこういう会社なんだなと思ったよ

      • by Anonymous Coward

        .NETなど前バージョンが存在していて中身はほぼ変更なし。みたいな場合だと前バージョンの内容みれば翻訳者が翻訳だしね
        MSDNの機械翻訳は優秀な方だし原文表示など選択肢も多くいしと、MSDNは褒められても文句言われるものでは無いと思いますね

        むしろあの膨大かつ詳細なドキュメントをせっせと人による翻訳をし続けるMSはさすがだと思いますよ

        • by Anonymous Coward on 2015年12月01日 22時31分 (#2926737)

          翻訳に利用しているMicrosoft Translator [bing.com]がテクノロジ系の語彙にかなり強いんですよ
          情報系の文章ならここの機械翻訳が一番です。Google 翻訳と同じく統計的機械翻訳。

          MSDNはあまり見ないけど、KBにはよく機械翻訳版のお世話になる
          人間の訳は、相変わらず気取った、遠まわしな表現ばかり使うので一部の人間には評判良くないですね。私はそこまで嫌いじゃないんですけど

          親コメント
          • by Anonymous Coward

            やっぱり情報系は素で強いというか、それ以外は弱いんですかね。
            もちろんhubは使ってるんでしょうが、お役所言葉の対応やいかに :-)

            あとまあ、プレスリリースの書き方じゃないですかね。
            あれだと台東区の行った台東区のサービスっぽいけど、実際は外部サービスへの誘導なんですよね。
            その前提で書けば良かったのに。

            #あと、google翻訳の元は英語版の方がマシになる気がするけどシステム的にかライセンス的にか不可能だったりするんですかね。

      • by Anonymous Coward

        最近は、ググって、ja-jp のページが出たら、何も考えずに、 URL を en-us に書き換えるようにしているんだけど、たまに、該当ページが存在しないことがあって辛い。
        Google から msdn ja-jp のリンクを抹殺したい。

        • by Anonymous Coward

          訳文/原文の切り替え出ませんか?

      • by Anonymous Coward

        MSDNは日本語があれなのよりも
        日本語ページだと英語のページに比べてAPIがごっそり消えてることの方が問題のような。

        機械翻訳すらないとしてもリストから抜くなよ……

  • 台東区らしいというか、下町っぽくていい
    港区とか世田谷区とか杉並区がやったら違和感あるし、やらないほうがいいと思う

  • by Anonymous Coward on 2015年12月01日 16時51分 (#2926540)

    そんなもん『機械翻訳です』て書いてあれば精度が低くたっていいと思うケド。
    そういう完璧主義が日本の弱いとこだと思うけどなぁ
    行儀が悪くたってさっさとやるのが大事かなと。

    • 多少精度が低いのは構わないとして...。結局現在の機械翻訳のレベルでは、何が言いたいのかさっぱりわからないというのが問題なんでしょうね。自分もいくつかそういう機械翻訳のページに遭遇しますが、「分かりづらい」のではなく「全く理解不能」なものがほとんどですからね...。
      親コメント
      • 台東区の公式サイトの冒頭の注意書き

        画面表示・サイト内検索について
        ホームページの切り替えに伴い、レイアウトが崩れて表示される場合があります。その場合は、ページを更新する(ブラウザの更新ボタンをクリック、キーボードの「F5」ボタンを押す)ことで、正しく表示されます。
        また、サイト内検索について、検索結果に切り替え前の古い情報(削除済みの情報)が表示される場合があります。解消されるまでもうしばらくおまちください。
        ご不便をおかけしますが、ご理解・ご協力を宜しくお願い致します。

        これのハンガリー語のページをちょこっと訳してみました:

        モニターの場所における捜索
        ウェブページにおける交換、その時レイアウトは現れるそれの崩壊。その場合そのページを新鮮にしなければならない(新鮮化ボタンをクリックしてください。キーボードの「F5」ボタンを押してください)存在せよ。その時正しく現れる。
        さらに、場所検索、古い情報変更前捜索結果(削除されたデータ)が現れる場合がある。解決するまでの間、長い間待ってくださいと我々はお願いします。
        不愉快なことをお詫びいたします、理解と協力に礼を言います。

        まぁ、元の日本語を読んでいれば、だいたい何のことは想像は付きますが、元を知らないと結構厳しいかも...。とは言え、日本語の機械翻訳の中ではこれはまだマシな方かと...。通常はもっと凄まじい訳になります。

        それ以前に気になったのは、「F5」ボタンを押すって何よってこと。当方では初期設定の状態で F5 ボタンを押すとキーボードのバックライトが暗くなるだけなんですけど? いや、こういう公的なサイトで機種依存的な(OS 依存か?)機能を何の臆面もなく書いていると言うのはどうなんだろうなと...。

        親コメント
    • by Anonymous Coward

      精度が悪いと批判されて日本語しか提供しなくなった挙句「Japanese only」とか書いちゃうんですよね、わかります...

      変な翻訳でもまずは提供してみようというのは大事だと思いますよ。

    • by Anonymous Coward

      誤訳があると「○○語のページにはこの条件の人はサービスを受けられるって書いてあるのに」とか、「○○語のページに誤訳があったので私はサービスを受ける機会を失った」みたいな余計なトラブルを引き起こすので、多くの自治体は怖くて手を出さないんじゃないですかね。

      • by Anonymous Coward

        「これは参考訳のため、実際のサービスや日本語の記述と食い違いがある場合があります」
        とでっかく書いておけばいいんじゃないの。

        良かれと思ってやっても、公序良俗に反するとして無効になるのかね。

        • by Anonymous Coward

          その注意書きがニュアンスまで含めて正しく翻訳できればいいね。

          • by Anonymous Coward

            その一文だけ、有料翻訳すりゃいい話でしょ。

    • by Anonymous Coward

      激しく同意。
      コスト・リスク・メリットのバランスを考える姿勢がそもそもない。

  • そもそも複数言語に対応するのには限界がある。
    翻訳の精度の問題もあるし、マルチリンガルを雇うのにも限界があるだろうし、そもそも地球上全ての言語に対応するのはまず不可能だし。
    かといって機械翻訳はまだ実用的ではないと思う。
    なので、変に多言語対応に力を入れることをやめて「やさしい日本語」 [hirosaki-u.ac.jp]のページを用意するのはどうだろう。
    実際、横浜市はやってるみたいですし [yokohama.lg.jp]。
    • その「やさしい日本語」を機械翻訳にかければいいんじゃないでしょうか。翻訳しやすい文章というのはありますからね。

      親コメント
    • by Anonymous Coward

      都内在住、しかも台東区近辺に住んでないとわかりにくいと思うけど、
      台東区 浅草、蔵前周辺は、
      ・成田空港~羽田空港直結電車路線が通っている
      ・浅草、スカイツリー、秋葉原という観光地のすぐ近く
      ・都内はもちろん、新幹線にも比較的アクセスが良い
      ということで、外国人旅行者のバックパッカー(=ガイドを雇わず、自分たちで地図見ながら歩く)人が多い。
      # 外国人バックパッカー向けの宿が多い
      しかも、アジアだけでなく、欧米、中東、ロシア系、人種が幅広い。

      そういうわけで、多国籍観光客の入り口となる区のサイトはブロークンでもいいから多言語対応のニーズが高い。

      • by Anonymous Coward

        とはいえ、ラテン語のニーズはないんじゃないかなぁ。
        # ウ゛ァチカンの人はイタリア語で大丈夫だろうし、古代ローマ人がタイムスリップして来た時に使えるくらいか?

    • by Anonymous Coward

      やさしい?
      隙間だらけで読みにくいことこの上ない。
      頭の悪い文章でしかないじゃん。

      つか、外人にやさしいなんて実は不要で、郷に入れば郷に従えってだけ。
      郷を構成する言語なんて、日本じゃ日本語一択か増えても数言語(今時は英語やポルトガル語ってとこは多いだろ)なんだから、それぞれちゃんとした言語で用意すべき。

      • by sitosi (38952) on 2015年12月02日 19時18分 (#2927389)
        「やさしい日本語」って「Basic English」を真似たものなのかしら? 善意の企画であることは間違いないんですけれど、外国人には結構ありがた迷惑なのかも知れない。

        まず、ただの観光旅行者ならば、やさしかろうと、難しかろうと日本語は理解できないから役に立たない。日本に居住している外国人ならば日本語の能力は必須だし、ある特定のサイトだけで変な、標準ではない日本語を読まされても却ってわかりにくいだけ。混乱します。現実に日本で生活する上では、周囲の日本人が話し、書いている日本語が理解できなければならないわけで、日本語ができる外国人のための配慮だと言うのであれば、たぶん、一番ありがたいのが、普通の日本語でそのまま書いて、かつルビを振ることなんじゃないかしら?

        現在、普通に日本語ができる外国人(西洋人を含む)はとても増えていて、日本語が流暢なのに、やたらと下手な英語で、あるいはアメリカ帰りの流暢な本場の米語で話しかけてくる日本人が多くて、結構困っている場合が多い。日本人は西洋人を見たら、必ず英語はできるものだと信じ込んでしまっているけれど、英語はできても“外国語”なので、日本人並に苦手だったり、一切英語なんてできないという西洋人も日本には多いのです。(でも、日本語は平気!)仮にある程度英語ができたとしても、本場 (?) の米語で発音されたら、まずわかりませんよね。欧州人が一般的に学ぶのは米語ではなく、英語ですから、英語の発音なら何とか聞き取れるかも...?

        ちなみに、機械翻訳の話ではないですが、京都などの寺院に入る時に日本人なら日本語の、西洋人なら英語のパンフが手渡されることが多いのですが、日本語のパンフに表記されている固有名詞はルビが触ってないので読めない (^^;)。英語のパンフレットのローマ字表記の方を読んで理解する始末。さらに笑ってしまうのが、英語のパンフレットで使われている度量衡が(凝り性の日本人のせいか?)だいたいヤードポンド法に換算されているのですよね。英米人以外の西洋人は皆、メートル法なのに!(この前オーストラリアに行ったら、車は左側通行だし、距離の表示も全部メートル法だったので感動しました。)だから実は西洋人の観光客にも不親切。英米人の観光客に配慮するのは構いませんが、英文パンフの度量衡の表記はせめてメートル法との併記にすべきでしょう。
        親コメント
  • by Anonymous Coward on 2015年11月30日 23時18分 (#2926088)

    どこで読んだのだか、検証された内容だったのか忘れたのですが、Googleの翻訳アルゴリズムは日本語のような言語には向いていないとかなんとか。英語からの翻訳ならそこそこマシな翻訳になるのかも?

    私が読んだ記事だか日記だかが古くて、現在のシステムは別物の可能性もあります。あいまいすぎてすみません。

    「ホームページシステムでの翻訳言語」も「辞書登録による翻訳精度向上」とあり、機械翻訳の予感がします。

    • 1年位前に試したところ、Weblioの訳の方がGoogleよりマシだった。英日訳の話。日常会話ならともかく、まともな文章で機械翻訳が使い物になる印象は全くないですね。下訳には使えますけど。

      親コメント
    • 翻訳エンジンと特定の言語との相性という問題はあるかもしれませんが、
      元になった文章の品質(文章構造とか論理性とか)も大きく結果に
      関わってくると思います。
      元ストーリーの 3段目(「いやしかし」で始まる部分)みたいに、
      日本人が読んでも何を言っているのか分からないような
      お粗末な文章は、翻訳には全く不向きでしょう。

      親コメント
    • Google 翻訳の本当の仕組みは知りませんが、何となく Google 翻訳は言語間翻訳のメタ言語(仲介言語)として英語を使っているのだろうなと想像しています。で、英語は印欧語族の言語なので、類型論的には屈折語由来なのですが、現在は中国語と同型の孤立語になっていると言っても構わないような言語になっています。その結果、一度英語に翻訳すると元の言語の語彙が持っていた格や人称、数、時制等の情報が失われてしまい、情報が削ぎ落とされた英語から、翻訳先の言語に翻訳する時にはテキトーな人称や数、格、時制等を付加しなければならなくなり、とんでもない訳になってしまいます。

      例えば、日本語や朝鮮語、モンゴル語、トルコ語、ハンガリー語等の間の翻訳ならば、系統論的には親縁言語ではなくても類型論敵に同類の言語ですから、この中のいずれかの言語をメタ言語にして翻訳すれば、互いにはだいぶ使い物になる翻訳になる可能性はありますが、間に英語を噛ましてしまうとシッチャカメッチャカで使い物にならない翻訳になってしまいます。

      Chrome のサイトの自動翻訳機能も同じエンジンを使っていると想像しますが、つい先日、ノルウェー語のサイトを読もうとすると、まず最初に日本語に翻訳されてしまいますが、これが全くの意味不明。ハンガリー語に訳しても珍紛漢紛。まともな文になってない。そこで英語にしてみたら、まぁ、それも酷い訳ではありましたが、何とか記事の主旨は理解できました。

      と言うわけで、自動翻訳は現状ではほとんど使い物にならないし、メタ言語を英語に限定している以上、今後も印欧語族以外の言語への翻訳の精度の改善は見込めないと想像しています。(メタ言語を英語にした場合でも、その時、形態素的には明示されなくても、可能性のある全ての文法的特徴をメタ情報として内在させ、翻訳先の言語で文法的に可能性のある組み合わせを全て候補として挙げられるような仕組みを作れば、英語でも使い物になるとは思いますが。)
      親コメント
    • 日本語、中国語(簡体)、英語を翻訳させると日本語の英訳・中国語訳の品質が良いとはいえないけど、中国語を日本語や英語にするのが一番ひどいと思った。Googleを使う中国語圏の人が相対的に少ないのかな。
      あまりにひどい時は翻訳結果を編集するんだけど、1文ずつしか編集できないから面倒でなかなか手伝う気にならない
      親コメント
      • by Anonymous Coward

        中国ではグーグルの人気が低い上グーグルのサービスの一部が遮断されてるのでしょうがない。

  • by Anonymous Coward on 2015年12月01日 17時32分 (#2926565)

    と◯◯語をまったく知らない人間に当然とばかりに要求するような人間が普通にいる世の中なので
    Google翻訳通せばOK的な仕事っぷりも普通の事なのでしょう

  • by Anonymous Coward on 2015年12月01日 17時48分 (#2926575)
    記事に採用したのはhylom氏かあ
    • by Anonymous Coward

      時間が起きてますね。

  • by Anonymous Coward on 2015年12月01日 18時14分 (#2926592)

    逆に外人がこれやってくることあるよね、
    翻訳サイトで変換した日本語が通じると思ってる奴。
    なにがいいたいのか全く伝わってないんだよ。

  • by Anonymous Coward on 2015年12月01日 18時27分 (#2926596)

    「何十万、何百万円かかりました」って言ったら、今度は「お金掛けすぎ!」って批判する人が沸いてくるんだから、自動翻訳で済むならそれでいいよ。

  • by Anonymous Coward on 2015年12月01日 20時30分 (#2926686)

    画像が日本語だらけなの何とかせんといかんのでは?

  • by Anonymous Coward on 2015年12月02日 2時26分 (#2926824)

    多言語対応で現代ヘブライ語と中東のどこかの言語対応やってくれ~と言われてやった時。
    とりあえず日英中韓のレイアウトそのままでRLOやってみたら見づらく感じたので
    ・このまま行く
    ・全て共通で使えるレイアウトに直す
    ・右から左に読む言語用レイアウトを作る
    どれにします~と軽く聞いたらいろんな人があつまって大会議に発展。意見が収束しないw

    最終的にこちらではレイアウト直さないで、ネイティブの人に渡すことになったのですが、どういう対応が良かったのか未だに判らない。

    経験者居ますかね?

typodupeerror

私はプログラマです。1040 formに私の職業としてそう書いています -- Ken Thompson

読み込み中...