パスワードを忘れた? アカウント作成
13769821 story
テクノロジー

総務省とNICT、多言語音声翻訳コンテストを開催。APIも開放 38

ストーリー by hylom
常識を超えるものは出てくるか 部門より
あるAnonymous Coward曰く、

総務省と情報通信研究機構(NICT)が「多言語音声翻訳アイデアコンテスト」を開催する(総務省の発表コンテストのWebサイト)。

世界の「言葉の壁」をなくす新しいアイデアを募集するとともに、概念実証(Proof of Concept、PoC)コンテストも行われる。これに合わせて、NICTが開発した多言語音声翻訳機能を利用できるAPIも公開される。

公開されるAPIは音声認識API、機械翻訳API、音声合成APIで、NICTの翻訳アプリ(VoiceTra)相当の精度の機能が使える様子。

スラドの皆さんは、どんなアレゲな翻訳機を作るのだろうか。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by wolf03 (39616) on 2018年11月17日 8時32分 (#3516994) 日記
    こういった物が出来ればなぁ
    • by Anonymous Coward

      信心がたらんのとちゃいますか?

    • by Anonymous Coward

      音声翻訳だから必要ですよね。
      笑いでも朗笑、失笑、冷笑、苦笑、嘲笑いろいろあるから
      誤訳で争いに発展しそう。

      • by Anonymous Coward

        日本のOkの指サインをサムアップに変換するとか。
        逆さに立てた箒を……ま何か適当に変換するとか。

    • by Anonymous Coward

      言語要らなくね、それ?

  • 公開されるAPIは音声認識API、機械翻訳API、音声合成API

    とあるので、任意に使い分けができるのであれば、色々使い道がありそうです。Androidなら、音声認識はAndroid Speech Recognizerの方が精度がよければそっち使うとか。

    --
    ほえほえ
    • by Anonymous Coward

      未踏事業とは組めなかったのかな

      • 広報活動が極めて弱いように思われますので、組む以前に知らないのだと思います。随分以前からあるサービス(VoiceTra)なんですけどね。ごく少数の民間業者と手を組んでるらしいですが。

        --
        ほえほえ
        親コメント
        • by Anonymous Coward

          手を組んだ民間業者の側ががんばって宣伝してるので、今後の知名度向上に期待。
          ポケトークW、家族の海外旅行に持たせようかと検討中。

          NICTの翻訳システム、どの言語もけっこう実用的に使えて便利。
          ただ、中国語翻訳が簡体字ベースっぽくて、日本語←→繁体中文のときに簡体中文を経由するらしく、
          繁体字の単語の処理がうまくいかないことがあるんだけど、今更修正は無理なんだろうな。

      • by nim (10479) on 2018年11月19日 11時56分 (#3517833)

        未踏はIPA=経産省、NICTは総務省なので、
        まあ、組むって考えはないでしょう。

        親コメント
  • by Anonymous Coward on 2018年11月17日 11時14分 (#3517074)
    やっと許してもらえるのですね

    まあ、同じ日本語どうしなのに意思の疎通に問題がある人もいるようですが
    • by Anonymous Coward

      なんとなくもう一回バベルの塔を立てるチャンスをもらえたような気もします。

    • by Anonymous Coward

      そりゃ閣議決定で意味を変更されちゃうからな

  • by Anonymous Coward on 2018年11月17日 8時07分 (#3516977)

    だがAPIは役立たなさそうだ

  • by Anonymous Coward on 2018年11月17日 8時18分 (#3516983)

    一度中間言語に変換して、そこからターゲットの言語に変換するタイプの翻訳はできないものだろうか

    • Re:中間言語 (スコア:4, 興味深い)

      by Anonymous Coward on 2018年11月17日 10時11分 (#3517046)

      それは過去に何度も試みられていますが、特定の2言語間に特化した機械翻訳をどうしても越えられません。
      ユニバーサルな中間言語(あるいは言語に依存しない意味表現と言ってもいいでしょうが)の設計は非常に困難ですし、たとえそのような中間言語が設計できたとしても、個別言語から中間言語への変換、また中間言語から個別言語への再変換にはまた別の大きな壁があります。
      生成文法では、仮に中間言語が設計できたと仮定したとき、そこからどのように実際の言語への変換が行われるかを説明しようとしていますが、研究者間の共通認識を得るにはまだ遠い状況です。

      親コメント
    • by Anonymous Coward

      アレげで中間言語を採用するならクリンゴン語一択だなw

      # 平和関係の語彙が全部なくなったりして?

    • by Anonymous Coward

      普通にあるでしょ

    • by Anonymous Coward

      エスペラント語よりボディーランゲージのほうが優れているような気がする

  • by Anonymous Coward on 2018年11月17日 9時58分 (#3517040)

    ……みたいなのを想像したけど、方言変換サイトってもうたくさんあるのね

    • by Anonymous Coward

      今の技術では方言認識はぜんぜんだめだ。だから親はSiriとか全く使い物にならない。

    • これだったらとても実用的。
      「・Kwa muda wa siku tatu, sijarudi. Nimeenda kouga kwenye dimbui la kijapani.
      三日間帰っていないので、銭湯に行ってきます。
      ・Huyo si mdudu. Ni taratibu iliyotumiwa.
      それはバグではなくて、仕様です。
      ・Ohh. Kama ni huyo purogurama, alitoroka jana.
      ああ、そのプログラマなら昨日逃げました。
      ・Bejeti au pesa zote zilizokadiriwa zimekwisha.
      予算は使い切りました。
      ・Itakuwa sawa nikirudi kesho?
      今日は帰っても良いですか?
      ・Huyo mdudu amesababisha hasara kubwa sana.
      このプログラムのバグは、致命的ですね。
      ・Nimeamura kuacha kazi.
      わたしは、転職することにしました。」
      https://sr [srad.jp]

  • by Anonymous Coward on 2018年11月17日 10時42分 (#3517057)

    お願いしたいワン。

  • by Anonymous Coward on 2018年11月17日 11時10分 (#3517071)

    ICUが集中治療室だったり、国際基督教大学だったり
    なんてのは他にもいろいろ有るだろうし。

    • by Anonymous Coward

      クラウド上のビッグデータを活用してコンテキストから統計的に判断します。

      • by Anonymous Coward

        コンテキストから文脈を認識???

    • by Anonymous Coward

      元となる辞書の入れ替えや出現率の多さで処理できるかと
      それでも分からなければそのまま通せば良いし
      形態素解析辺りだとそんな感じで処理してますよ

    • by Anonymous Coward

      グーグルマップの外国の地名の適当な翻訳を見れば、不完全で人に迷惑かけるだけのプログラムとデータしか作れていないことがよくわかる。

    • by Anonymous Coward

      逆でしょう。文脈から概念と関係性を特定していく。

      「ICUに入る」だけじゃ区別付かないのは人間だって同じだし
      マップの地名なんて文脈もヘッタクレもないから訳しようもないけど、
      会話や文章というのは語を並べて意味を生み出すためのものなんだから
      それなりの語彙構築と共起度解析で人間と同じように解釈することはできるよ。

      教師が堅物だと「完全にAUTO」とか「95割」みたいなアホフレーズには対応できないだろうけど。

  • by Anonymous Coward on 2018年11月18日 2時09分 (#3517430)

    話した言葉を翻訳して音として再生、というのを思い浮かべるけど、最終的には翻訳が一番足を引っ張りそう。
    (某シンギュラリティ本にもちゃんとした翻訳は最高レベルに難しい、みたいに書かれていたと思う)

    たとえ人間と同等レベル以上のAIができて、多言語と翻訳スキルをみっちり教え込ませたとしても
    そもそも訳ができない言葉もあるだろうし、翻訳元の言語では省略されている要素を特定できないこともあるだろうし、
    翻訳という手法だけではどうしようもない部分が出てくるように思う。

    それを補おうとするなら注釈(訳注)をつける必要が出てくると思うが、
    もとの話し手の言葉であるかのように音をつくるとすると、注釈とは相性が悪い。

    そう考えると、最終的には 翻訳 というより、いろいろ解説してくれたり、不足した情報を発言者に質問したりする通訳者のような存在が必要なのではないかと思う。

  • by Anonymous Coward on 2018年11月18日 8時18分 (#3517478)

    自分「いつも『愛してる』ばかりじゃマンネリだから、良い感じに翻訳機に言い換えて貰おう」

    自分「愛してる」→(翻訳機が翻訳)→「月がきれいですね」→(相手の翻訳機が翻訳)→「愛してる」→相手
    意味が無かった・・・

    • by Anonymous Coward

      星新一のショートショートにそんな話があったような
      みんな通訳のオウム型ロボットを型に乗せていて、セールスマンと客の会話が

      客「いらないわ」

      客のオウム「大変魅力的なのですが主人と相談しないと決められないのでうんたらかんたら」

      セールスマンのオウム「買わないとさ」

      みたいになるやつ

  • by Anonymous Coward on 2018年11月19日 17時55分 (#3518004)

    人間には「パケラッター」としか聞こえないO次郎が何を言っているのか、リアルタイムで的確な日本語に翻訳してしまう翻訳エンジンは、いま思えば凄い。

    # OPの歌詞では「何もできないけど」とあるが、いろいろできるんだよね...

typodupeerror

あつくて寝られない時はhackしろ! 386BSD(98)はそうやってつくられましたよ? -- あるハッカー

読み込み中...