パスワードを忘れた? アカウント作成
15324290 story
人工知能

大日本印刷、橋と箸、端のイントネーション違いを表現できる音声合成AI 42

ストーリー by nagazou
同音異義語まみれの早口言葉をしゃべらせたい 部門より
大日本印刷(DNP)は、企業向けに漢字の読み間違いが従来製品よりも約50~70%減らした音声合成システムを開発したそうだ。この音声合成システムでは、「行って」が「いって」なのか「おこなって」なのか判別できるほか、「橋」「箸」「端」のイントネーションの違いも識別できるらしい(大日本印刷動画ITmedia)。

こうした改善により、漢字の読みの間違いを大幅に削減したほか、イントネーションとアクセント、文脈を加味した上で自動生成することにより、人間が読んだときのナレーションに近い自然な音声合成を実現した。また追加学習による精度向上も期待できるとしている。テキスト量の多いコンテンツや正しい読みやナレーションを重視する学校教材や電子書籍、契約書などに適したものだとしている。今後、同社の製品に導入していくとしている。

  • by Anonymous Coward on 2021年06月22日 6時39分 (#4055299)

    「橋」単体の時と、名前としての「○○橋(バシ)」の時で違わないだろうか。
    単体の時は「端」に近い気がする。

    ここに返信
    • by Anonymous Coward

      徳島だと、変わらないな。合理的。

    • by Anonymous Coward

      標準語のアクセントについていうとき、
      ほんとに単体のときは「端」と変わらないね。高い音を大文字で書くとすると ha-SHI。
      ただし、後ろに助詞がつくと変わって、「橋が」 ha-SHI-ga、「端が」 ha-SHI-GA。

      複合語の「○○橋」のときは、もとの「橋」のアクセントとは無関係で、
      複合語としてのアクセントだとしかいいようがない(多少の生成ルールがないわけではないけれど)。
      「日本橋(で)」 ni-HO-M-BA-SHI(-DE)、「新橋(で)」 SHI-m-ba-shi(-de)

  • by Anonymous Coward on 2021年06月22日 7時16分 (#4055305)

    株式会社アピリッツはわざと読み間違える音声合成システム「hylom II」を開発した

    ここに返信
    • by Anonymous Coward

      読み間違いが従来製品よりも約50~70%減らした
      も、hylom文法を引き継いでますね

  • by tamago915 (19926) on 2021年06月22日 8時10分 (#4055317) 日記

    この製品がどのようになっているかはわからないのですが、YouTubeでよく見られる合成音声(いわゆる「ゆっくりボイス」)ですと、ひらがなの「は」が正しく発音できず、/ha/と/wa/が入れ替わってしまうことが少なからずあります。
    文法解釈や形態素解析で対応しきれないのか、文章の作り手側にも問題があるのか。

    ここに返信
    • by Anonymous Coward

      ゆっくりは「それも味」ぐらいに思ってるんじゃないの?
      20年前のIBMの読み上げでもそん間違いはほぼなかったと思う
      漢字は間違えまくってたけど

    • by Anonymous Coward

      ○○サン ソレハ助詞としての ヘ・ヲ・ハ のことデハ?

      #「ゐ」「ゑ」を区別して喋っていた古典教師の思い出があるのでAC

  • by Anonymous Coward on 2021年06月22日 6時31分 (#4055298)

    これに出てくる3つの「ん」の音は違う音なのだが、イントネーションだけでなくこれらの音も正しく再現してくれるのだろうか?

    ここに返信
    • by Anonymous Coward

      このAIなら 「3の倍数と3が付く数字のときだけアホになります」 [wikipedia.org] の強力版が実現できますね。

    • by Anonymous Coward

      × 3つの「ん」の音は違う音
      ○ 5つの「ん」の音は 4通りの音

      「さ "ん" ね "ん" さ "ん" くみさ "ん" ば "ん"」
      sa-"n"-ne-"n"-sa-"ŋ"-kumisa-"m"-ba-"ɴ"

      • by Anonymous Coward

        「さんねん みくみ スリーばん」などの可能性は考えましたか?
        このAIならきっと正しく読んでくれるでしょう。

      • by Anonymous Coward

        ご指摘ありがとうございます。
        3に含まれている3つの「ん」と書くべきでした。
        同じ「さん」でも続く音により「ん」の音が変化することを書きたかったので。

  • by Anonymous Coward on 2021年06月22日 8時34分 (#4055326)

    一般人
    逸般人
    いっぱん人

    ここに返信
  • by Anonymous Coward on 2021年06月22日 9時21分 (#4055343)

    「人材」を「ひとざい」と読まずに「じんざい」と読むことはそんなに高度なこと?

    ここに返信
    • by Anonymous Coward on 2021年06月22日 12時36分 (#4055470)

      「汚職事件」と「お食事券」を読み分けられれば上級。

    • by Anonymous Coward

      熟語は音読みが多く、訓読みと組み合わせるケースは少ないと思う

      市立図書館を「しりつとしょかん」ではなく「いちりつとしょかん」と読むのは呼び分けだけど

      • by Anonymous Coward

        「首長」を最近は偉い人が公式の場でも「くびちょう」と読んでいるのを聞ともやっとする

        • by Anonymous Coward

          なにかあった時に「首を切る」か「首を切られる」人だからクビの長で良いんでは?

    • by Anonymous Coward

      「人材」を「じんざい」と読めるのは普通だけれど、「人財」のように存在しない熟語を、
      「『人財』という熟語はない。『人』単独では通常『ひと』と読み、『財』単独では『巨万の財をなす』などのように『ざい』と読む。よって、『ひとざい』だろう」
      ではなく、
      「『人財』という熟語はないが、漢熟語のように見える。漢熟語は一般的に音読みだろう。なんだったらこれは『人材』に掛けた造語なのでは? とすると、『じんざい』と読むべきか」
      と判断するのが高度なのでは。

      動画を見ずに言っているので、とんちんかんかも知れないけど。

    • by Anonymous Coward

      「まぎゃく」ではなく「まさか」と読んでくれるだろうか

      • by Anonymous Coward

        「まぎゃく」ではなく「まさか」と読んでくれるだろうか

        (ヾノ・∀・`) まっさかー

      • by Anonymous Coward

        まさかと読むのが正しいのにまさかと読むとバカにされる、現代の悲哀ですね

    • by Anonymous Coward

      「それは大事。」
      「それが大事。」
      「それが一番大事。」

      これだと辞書だけじゃなくてAIも必要かなあ

  • by Anonymous Coward on 2021年06月22日 9時27分 (#4055348)

    九州の崩壊アクセント地域に生まれた為アクセントの感覚がなく、ハシもアメも全部いっしょ。
    中学に入って英語の授業でアクセントというのが出てきて、全く分からないまま今まで来てしまった。

    ここに返信
    • by Anonymous Coward

      日本語のアクセントは高低によるもので、英語のアクセントは強弱だから関係ないのでは?

      • by Anonymous Coward

        崩壊アクセントでは「アクセント自体の概念」が無いので、日本語のアクセントをどんなに「この様に違うよ」と説明されても理解できません。
        英語でも意識できないので理解できなかった。

        • by Anonymous Coward

          理解出来ないとはいうものの、アクセントがないわけでもランダムでもなく同じ単語に対しては同じアクセントで発音するんだよな。本当に理解してないん?

  • by Anonymous Coward on 2021年06月22日 9時53分 (#4055370)

    姫路と姫路は?

    ここに返信
  • by Anonymous Coward on 2021年06月22日 10時07分 (#4055378)

    NHKのアナウンサーのイントネーションを聞いていて奇妙に聞こえる例がいくつかある

    熊が出没したというニュースで、熊(クを強調)のことを顔にできる隈(マを強調)のイントネーションで読んでいる
    まさか隈をクを強調して読むんだろうか?

    電車は平板に読むのが普通だと思うのだが、NHKではデを強調して読んでいる

    この2例は頻繁に聞くので気持ち悪くて仕方がない

    ここに返信
    • by Anonymous Coward

      全国ニュースはいろいろなイントネーションがいつのまにか変わっていて気持ち悪い
      その頃の平均的なイントネーションにあわせて変化させているらしいですが

      • by LARTH (14573) on 2021年06月22日 22時18分 (#4055988) 日記

        NHK日本語発音アクセント新辞典 [nhk.or.jp](2016)
        多分2年ぐらい前から新しいアクセントが徹底されるようになってきてる。出演者に付いては1年ぐらい前からだと思う。

        すべての単語で、外来語であっても必ず語頭にアクセントがあるのでかなり気持ち悪い。NHKの場合「強い」アクセントも同時に付ける傾向が高く違和感マシマシ。極端な人だと外国人が話してるのかってぐらい。

        • by Anonymous Coward

          新辞典適用以降の放送は本当に気持ち悪いよね。
          「NHKアナウンサーを対象におこなった大規模な調査」に基づいたとあるので、
          発音に対するNHKアナウンサーの意識が、かつてに比べて低下しているんだろう。

          NHKには日本語発音のお手本でありつづけてほしかった。

    • by Anonymous Coward

      自分もク↑マ↓とク↓マ↑を読み分ける文化で育ったので、テレビ番組中で「熊はク↓マ↑って発音するのが正しいんですよ」などと言及されていて凄い違和感だった

      まあ「茨城」は本来「(イエ)バラキ゜」だったのが明治維新で九州訛りが入って「イバラキ」になった、って聞いて納得できたので、標準語は関東弁とは違うと思うようにしている

  • by Anonymous Coward on 2021年06月22日 10時40分 (#4055396)

    役人「看板にスピーカーつけて音声合成AIによる音声ガイダンスも流すようにしてみました」
    一休「よけいなことを・・・」

    ここに返信
    • by Anonymous Coward

      標準語だと「この橋」も「この端」も、
      "ko-NO-HA-SHI, wa-TA-RU-BE-KA-ra-zu"
      となり、区別がつかないはず (※)。
      「このハシ"を"」なら、
      "ko-NO-HA-SHI-o, wa-TA-RU-BE-KA-ra-zu"
      "ko-NO-HA-SHI-O, wa-TA-RU-BE-KA-ra-zu"
      で区別ついたかも知れないが。

      (※) 「区別つかないはず」とはいうものの、体感的には
      「この橋」も「この端」も、低い「こ」から高い「し」にかけて音が上がっていくのだが、
      「この端」の方が、上がっていくペースがゆっくり(「この橋」の「の」は高めで、「この端」の「の」は低め)

  • by Anonymous Coward on 2021年06月22日 13時26分 (#4055510)

    FM TOWNSのTOWNS OSにテキスト読み上げソフトのTOWNSTalkが入ってましたが、漢字変換や句読点をちゃんとしてやればかなり自然な読み上げを実現できていたような記憶があります。昔のことなので記憶が美化されてるかもしれませんけど。

    昔のは人力での辞書的な方法でやっていて、今回のはAIでの学習だから楽に作れるみたいな話なのでしょうか。
    結局知らない単語には対応できなさそうな気もしますが。

    ここに返信
typodupeerror

人生unstable -- あるハッカー

読み込み中...