台東区のホームページ、機械翻訳を使って89の外国語に対応。うち81言語はGoogle翻訳 52
ストーリー by hylom
機械翻訳を公式とするのはどうなのよ 部門より
機械翻訳を公式とするのはどうなのよ 部門より
maia 曰く、
東京都台東区が11月30日の夜間に公式サイトをリニューアルし、89の外国語に対応した(プレスリリース)。ただし、「この翻訳は、プログラムを用いて機械的に行われますので、内容が正確であるとは限りません」との注釈も付いている。
リニューアル前は英語および中国語(簡体字)、韓国語の3か国語のみの対応だったが、リニューアル後は「ホームページシステムでの翻訳」で中国語(繁体字)およびフランス語、タイ語、マレー語、インドネシア語に対応。これらは「辞書登録による翻訳精度向上、画像の翻訳にも対応」しているという。また、残りの81言語はグーグルの翻訳システムを使うという。
いやしかし、翻訳不可能性ないし翻訳の不確定性という命題を考えた方がいいのではなかろうか。まして、会話ではなく、静的な文章である。翻訳結果に責任を持てるよう、それぞれの言語に精通した人材がチェックした方がよいと思われるし、そうなると、ほんの僅かな言語数対応か、翻訳対応のコンテンツ(ページ)を限定しておくのが限界だと思う。老婆心ながら。
なお、2012年には東北観光博外国語版ウェブサイト、自動翻訳による誤訳のため一時閉鎖という時間も起きている。
翻訳結果に責任を持てるよう~ (スコア:3)
それ MSDN Library にも言ってあげてください。
例えばこういうの
https://msdn.microsoft.com/ja-jp/library/office/ff845670.aspx [microsoft.com]
uxi
Re:翻訳結果に責任を持てるよう~ (スコア:1)
先を越された!
ってのはともかく、MSDNは訳がおかしかったら原典を見ることができる人だけが読む前提なので、そうでない人が読む役所の広報はちょっと違うと思う。(ので、MSDNは放置でよいがこれはまずい)
Re:翻訳結果に責任を持てるよう~ (スコア:1)
# 自社製品の他国語リソースで翻訳した分が、機械翻訳の辞書に反映されてないのは相変わらずアホだと思うけど。
Re: (スコア:0)
でもまずい、と言っても人でも金も無いよ(だから無料のgoogle翻訳を使っている)。あまり正確でない翻訳を載せるかタレこみ文にあるように少数の正しい翻訳文のみ載せるか。
Re:翻訳結果に責任を持てるよう~ (スコア:2)
そこでボランティア(ここでは「タダで使える外国人」の意)の活用ですよ。
以前ある自治体のサイトを見たら、外国語のページに、海外からの留学生によって
翻訳された旨が記されていました。とりあえずオリンピックを錦の御旗にすれば
いいんじゃないでしょうかね。
Re:翻訳結果に責任を持てるよう~ (スコア:3, 興味深い)
外国人です。こういうボランティア活動は家でも出来るのか特徴で、もっと増えてほしいです。
# 履歴書にも書けるから
Re:翻訳結果に責任を持てるよう~ (スコア:1)
Re: (スコア:0)
タダで使える外国人(ここでは「奴隷」の意)
Re: (スコア:0)
俺もそう思ってたんだけど、
きのうMicrosoft Solitaireで遊んだら
ルール説明が見事に意味不明で、ああこういう会社なんだなと思ったよ
Re: (スコア:0)
.NETなど前バージョンが存在していて中身はほぼ変更なし。みたいな場合だと前バージョンの内容みれば翻訳者が翻訳だしね
MSDNの機械翻訳は優秀な方だし原文表示など選択肢も多くいしと、MSDNは褒められても文句言われるものでは無いと思いますね
むしろあの膨大かつ詳細なドキュメントをせっせと人による翻訳をし続けるMSはさすがだと思いますよ
Re:翻訳結果に責任を持てるよう~ (スコア:1)
翻訳に利用しているMicrosoft Translator [bing.com]がテクノロジ系の語彙にかなり強いんですよ
情報系の文章ならここの機械翻訳が一番です。Google 翻訳と同じく統計的機械翻訳。
MSDNはあまり見ないけど、KBにはよく機械翻訳版のお世話になる
人間の訳は、相変わらず気取った、遠まわしな表現ばかり使うので一部の人間には評判良くないですね。私はそこまで嫌いじゃないんですけど
Re: (スコア:0)
やっぱり情報系は素で強いというか、それ以外は弱いんですかね。
もちろんhubは使ってるんでしょうが、お役所言葉の対応やいかに :-)
あとまあ、プレスリリースの書き方じゃないですかね。
あれだと台東区の行った台東区のサービスっぽいけど、実際は外部サービスへの誘導なんですよね。
その前提で書けば良かったのに。
#あと、google翻訳の元は英語版の方がマシになる気がするけどシステム的にかライセンス的にか不可能だったりするんですかね。
Re: (スコア:0)
最近は、ググって、ja-jp のページが出たら、何も考えずに、 URL を en-us に書き換えるようにしているんだけど、たまに、該当ページが存在しないことがあって辛い。
Google から msdn ja-jp のリンクを抹殺したい。
Re: (スコア:0)
訳文/原文の切り替え出ませんか?
Re: (スコア:0)
MSDNは日本語があれなのよりも
日本語ページだと英語のページに比べてAPIがごっそり消えてることの方が問題のような。
機械翻訳すらないとしてもリストから抜くなよ……
こういう「やっちゃえ」感はいい (スコア:3)
台東区らしいというか、下町っぽくていい
港区とか世田谷区とか杉並区がやったら違和感あるし、やらないほうがいいと思う
精度が書いてあればいいと思うケド (スコア:2, すばらしい洞察)
そんなもん『機械翻訳です』て書いてあれば精度が低くたっていいと思うケド。
そういう完璧主義が日本の弱いとこだと思うけどなぁ
行儀が悪くたってさっさとやるのが大事かなと。
Re:精度が書いてあればいいと思うケド (スコア:2)
Re:精度が書いてあればいいと思うケド (スコア:2)
画面表示・サイト内検索について
ホームページの切り替えに伴い、レイアウトが崩れて表示される場合があります。その場合は、ページを更新する(ブラウザの更新ボタンをクリック、キーボードの「F5」ボタンを押す)ことで、正しく表示されます。
また、サイト内検索について、検索結果に切り替え前の古い情報(削除済みの情報)が表示される場合があります。解消されるまでもうしばらくおまちください。
ご不便をおかけしますが、ご理解・ご協力を宜しくお願い致します。
これのハンガリー語のページをちょこっと訳してみました:
モニターの場所における捜索
ウェブページにおける交換、その時レイアウトは現れるそれの崩壊。その場合そのページを新鮮にしなければならない(新鮮化ボタンをクリックしてください。キーボードの「F5」ボタンを押してください)存在せよ。その時正しく現れる。
さらに、場所検索、古い情報変更前捜索結果(削除されたデータ)が現れる場合がある。解決するまでの間、長い間待ってくださいと我々はお願いします。
不愉快なことをお詫びいたします、理解と協力に礼を言います。
まぁ、元の日本語を読んでいれば、だいたい何のことは想像は付きますが、元を知らないと結構厳しいかも...。とは言え、日本語の機械翻訳の中ではこれはまだマシな方かと...。通常はもっと凄まじい訳になります。
それ以前に気になったのは、「F5」ボタンを押すって何よってこと。当方では初期設定の状態で F5 ボタンを押すとキーボードのバックライトが暗くなるだけなんですけど? いや、こういう公的なサイトで機種依存的な(OS 依存か?)機能を何の臆面もなく書いていると言うのはどうなんだろうなと...。
Re: (スコア:0)
精度が悪いと批判されて日本語しか提供しなくなった挙句「Japanese only」とか書いちゃうんですよね、わかります...
変な翻訳でもまずは提供してみようというのは大事だと思いますよ。
多言語に対応する志はよし (スコア:1)
しかし台東区だけ頑張ればよいという問題でもないし、
モデレータは基本役立たずなの気にしてないよ
Re: (スコア:0)
Re: (スコア:0)
誤訳があると「○○語のページにはこの条件の人はサービスを受けられるって書いてあるのに」とか、「○○語のページに誤訳があったので私はサービスを受ける機会を失った」みたいな余計なトラブルを引き起こすので、多くの自治体は怖くて手を出さないんじゃないですかね。
Re: (スコア:0)
「これは参考訳のため、実際のサービスや日本語の記述と食い違いがある場合があります」
とでっかく書いておけばいいんじゃないの。
良かれと思ってやっても、公序良俗に反するとして無効になるのかね。
Re: (スコア:0)
その注意書きがニュアンスまで含めて正しく翻訳できればいいね。
Re: (スコア:0)
その一文だけ、有料翻訳すりゃいい話でしょ。
Re: (スコア:0)
激しく同意。
コスト・リスク・メリットのバランスを考える姿勢がそもそもない。
やさしい日本語 (スコア:2)
翻訳の精度の問題もあるし、マルチリンガルを雇うのにも限界があるだろうし、そもそも地球上全ての言語に対応するのはまず不可能だし。
かといって機械翻訳はまだ実用的ではないと思う。
なので、変に多言語対応に力を入れることをやめて「やさしい日本語」 [hirosaki-u.ac.jp]のページを用意するのはどうだろう。
実際、横浜市はやってるみたいですし [yokohama.lg.jp]。
Re:やさしい日本語 (スコア:1)
その「やさしい日本語」を機械翻訳にかければいいんじゃないでしょうか。翻訳しやすい文章というのはありますからね。
台東区だから (スコア:0)
都内在住、しかも台東区近辺に住んでないとわかりにくいと思うけど、
台東区 浅草、蔵前周辺は、
・成田空港~羽田空港直結電車路線が通っている
・浅草、スカイツリー、秋葉原という観光地のすぐ近く
・都内はもちろん、新幹線にも比較的アクセスが良い
ということで、外国人旅行者のバックパッカー(=ガイドを雇わず、自分たちで地図見ながら歩く)人が多い。
# 外国人バックパッカー向けの宿が多い
しかも、アジアだけでなく、欧米、中東、ロシア系、人種が幅広い。
そういうわけで、多国籍観光客の入り口となる区のサイトはブロークンでもいいから多言語対応のニーズが高い。
Re: (スコア:0)
とはいえ、ラテン語のニーズはないんじゃないかなぁ。
# ウ゛ァチカンの人はイタリア語で大丈夫だろうし、古代ローマ人がタイムスリップして来た時に使えるくらいか?
Re: (スコア:0)
やさしい?
隙間だらけで読みにくいことこの上ない。
頭の悪い文章でしかないじゃん。
つか、外人にやさしいなんて実は不要で、郷に入れば郷に従えってだけ。
郷を構成する言語なんて、日本じゃ日本語一択か増えても数言語(今時は英語やポルトガル語ってとこは多いだろ)なんだから、それぞれちゃんとした言語で用意すべき。
Re:やさしい日本語 (スコア:2)
まず、ただの観光旅行者ならば、やさしかろうと、難しかろうと日本語は理解できないから役に立たない。日本に居住している外国人ならば日本語の能力は必須だし、ある特定のサイトだけで変な、標準ではない日本語を読まされても却ってわかりにくいだけ。混乱します。現実に日本で生活する上では、周囲の日本人が話し、書いている日本語が理解できなければならないわけで、日本語ができる外国人のための配慮だと言うのであれば、たぶん、一番ありがたいのが、普通の日本語でそのまま書いて、かつルビを振ることなんじゃないかしら?
現在、普通に日本語ができる外国人(西洋人を含む)はとても増えていて、日本語が流暢なのに、やたらと下手な英語で、あるいはアメリカ帰りの流暢な本場の米語で話しかけてくる日本人が多くて、結構困っている場合が多い。日本人は西洋人を見たら、必ず英語はできるものだと信じ込んでしまっているけれど、英語はできても“外国語”なので、日本人並に苦手だったり、一切英語なんてできないという西洋人も日本には多いのです。(でも、日本語は平気!)仮にある程度英語ができたとしても、本場 (?) の米語で発音されたら、まずわかりませんよね。欧州人が一般的に学ぶのは米語ではなく、英語ですから、英語の発音なら何とか聞き取れるかも...?
ちなみに、機械翻訳の話ではないですが、京都などの寺院に入る時に日本人なら日本語の、西洋人なら英語のパンフが手渡されることが多いのですが、日本語のパンフに表記されている固有名詞はルビが触ってないので読めない (^^;)。英語のパンフレットのローマ字表記の方を読んで理解する始末。さらに笑ってしまうのが、英語のパンフレットで使われている度量衡が(凝り性の日本人のせいか?)だいたいヤードポンド法に換算されているのですよね。英米人以外の西洋人は皆、メートル法なのに!(この前オーストラリアに行ったら、車は左側通行だし、距離の表示も全部メートル法だったので感動しました。)だから実は西洋人の観光客にも不親切。英米人の観光客に配慮するのは構いませんが、英文パンフの度量衡の表記はせめてメートル法との併記にすべきでしょう。
翻訳元となる言語しだいかも (スコア:0)
どこで読んだのだか、検証された内容だったのか忘れたのですが、Googleの翻訳アルゴリズムは日本語のような言語には向いていないとかなんとか。英語からの翻訳ならそこそこマシな翻訳になるのかも?
私が読んだ記事だか日記だかが古くて、現在のシステムは別物の可能性もあります。あいまいすぎてすみません。
「ホームページシステムでの翻訳言語」も「辞書登録による翻訳精度向上」とあり、機械翻訳の予感がします。
Re:翻訳元となる言語しだいかも (スコア:2)
1年位前に試したところ、Weblioの訳の方がGoogleよりマシだった。英日訳の話。日常会話ならともかく、まともな文章で機械翻訳が使い物になる印象は全くないですね。下訳には使えますけど。
Re:翻訳元となる言語しだいかも (スコア:2)
翻訳エンジンと特定の言語との相性という問題はあるかもしれませんが、
元になった文章の品質(文章構造とか論理性とか)も大きく結果に
関わってくると思います。
元ストーリーの 3段目(「いやしかし」で始まる部分)みたいに、
日本人が読んでも何を言っているのか分からないような
お粗末な文章は、翻訳には全く不向きでしょう。
Re:翻訳元となる言語しだいかも (スコア:2)
例えば、日本語や朝鮮語、モンゴル語、トルコ語、ハンガリー語等の間の翻訳ならば、系統論的には親縁言語ではなくても類型論敵に同類の言語ですから、この中のいずれかの言語をメタ言語にして翻訳すれば、互いにはだいぶ使い物になる翻訳になる可能性はありますが、間に英語を噛ましてしまうとシッチャカメッチャカで使い物にならない翻訳になってしまいます。
Chrome のサイトの自動翻訳機能も同じエンジンを使っていると想像しますが、つい先日、ノルウェー語のサイトを読もうとすると、まず最初に日本語に翻訳されてしまいますが、これが全くの意味不明。ハンガリー語に訳しても珍紛漢紛。まともな文になってない。そこで英語にしてみたら、まぁ、それも酷い訳ではありましたが、何とか記事の主旨は理解できました。
と言うわけで、自動翻訳は現状ではほとんど使い物にならないし、メタ言語を英語に限定している以上、今後も印欧語族以外の言語への翻訳の精度の改善は見込めないと想像しています。(メタ言語を英語にした場合でも、その時、形態素的には明示されなくても、可能性のある全ての文法的特徴をメタ情報として内在させ、翻訳先の言語で文法的に可能性のある組み合わせを全て候補として挙げられるような仕組みを作れば、英語でも使い物になるとは思いますが。)
Re:翻訳元となる言語しだいかも (スコア:1)
あまりにひどい時は翻訳結果を編集するんだけど、1文ずつしか編集できないから面倒でなかなか手伝う気にならない
Re: (スコア:0)
中国ではグーグルの人気が低い上グーグルのサービスの一部が遮断されてるのでしょうがない。
◯◯語版作って(簡単でしょ) (スコア:0)
と◯◯語をまったく知らない人間に当然とばかりに要求するような人間が普通にいる世の中なので
Google翻訳通せばOK的な仕事っぷりも普通の事なのでしょう
感慨・・・ (スコア:0)
Re: (スコア:0)
時間が起きてますね。
あくまで補助ツール (スコア:0)
逆に外人がこれやってくることあるよね、
翻訳サイトで変換した日本語が通じると思ってる奴。
なにがいいたいのか全く伝わってないんだよ。
Re:あくまで補助ツール (スコア:1)
フリーウェアに対する質問とか要望で、英語に機械翻訳したメールを送りつけてくる人はよくいる。
ロシア人に多いイメージ。
Re:あくまで補助ツール (スコア:2)
中国人も多いです。
逆に原文が無くて読めない。しかも仕事の書類とかでそれをやる。
コスト掛けて作って (スコア:0)
「何十万、何百万円かかりました」って言ったら、今度は「お金掛けすぎ!」って批判する人が沸いてくるんだから、自動翻訳で済むならそれでいいよ。
無粋なこと言わせてくれ。 (スコア:0)
画像が日本語だらけなの何とかせんといかんのでは?
右から左に書く言語 (スコア:0)
多言語対応で現代ヘブライ語と中東のどこかの言語対応やってくれ~と言われてやった時。
とりあえず日英中韓のレイアウトそのままでRLOやってみたら見づらく感じたので
・このまま行く
・全て共通で使えるレイアウトに直す
・右から左に読む言語用レイアウトを作る
どれにします~と軽く聞いたらいろんな人があつまって大会議に発展。意見が収束しないw
最終的にこちらではレイアウト直さないで、ネイティブの人に渡すことになったのですが、どういう対応が良かったのか未だに判らない。
経験者居ますかね?
Re: (スコア:0)
鏡像にする。
Re: (スコア:0)
数字とかLROだったような