パスワードを忘れた? アカウント作成
13277794 story
テクノロジー

1分間の音声から声の特徴を収集してその人のしゃべり声を任意に合成できるという技術が登場 43

ストーリー by hylom
声優業界の危機? 部門より

「1分間の音声だけでその声をコピーできる」というアルゴリズムが開発されたそうだ。カナダ・Lyrebirdが開発したもので、同社のデモページでは米トランプ大統領やオバマ前大統領、ヒラリー・クリントン氏のコピー音声による「議論」などが公開されている(TechableThe Next Web)。

この技術はまだ開発中とのことだが、将来的にはAPIを提供しさまざまなアプリケーションで利用できるようになる模様。このような技術を提供する企業は同社が初だという。

なお、この技術が裁判などで悪用される可能性については、今後音声を簡単にねつ造できるという事実が広まることで、音声は証拠能力に欠けているという風潮が広まってほしいと同社Webサイトには記されている

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by ymasa (31598) on 2017年05月12日 7時40分 (#3209383) 日記

    他人が作った著作物?を勝手に使ったら著作権問題になりませんかね?

    私的利用しているうちは問題がないのでしょうけども。

    声に関する権利は存在するのでしょうか?
    https://oshiete.goo.ne.jp/qa/925550.html [goo.ne.jp]

    声についても,著作権や肖像権に相当するものが認められています。
    http://www.asj.gr.jp/qanda/answer/74.html [asj.gr.jp]

    著作隣接権
    http://www.iprchitekizaisan.com/chosakuken/rinsetsuken.html [iprchitekizaisan.com]

    • by Anonymous Coward on 2017年05月12日 9時14分 (#3209422)

      多分著作権はない。

      (1)もし声質に著作権があるとすると、声色を真似た朗読や歌唱にまでオリジナルの朗読者や歌手の著作権が及ぶことになる。(本当にそっくりに真似るのは別。)
      しかも死後50年も。これは創作活動に大きな支障になる。フォントに著作権が存在しないのと同趣旨。

      (2)また2つ目のリンクには
      >すなわち,放送された音声を,音声合成,音声符号化,音声認識などの研究目的に用いる場合も,許諾を得ることが必要です
      とあるけど、今の法律では著作権法47の7にあるように、情報解析に使用することは許可されている。

      では解析の結果、再合成された音声に著作権が及ぶかといえば、全く別の言葉を喋らせるのであれば、上記の(1)から著作権は及ばないと思う。
      (ある程度長い詩や演説の朗読を、オリジナルとそっくりに合成音声で再現させるのは、著作者隣接権に引っかかるかも)。

      親コメント
      • by Anonymous Coward

        >フォントに著作権が存在しないのと同趣旨。
        フォントには著作権が存在します。
        書体には著作権が存在しないですが。

        • by Anonymous Coward

          テレ朝と視覚デザイン研究所の裁判ではフォントに著作権は無い=無断で商用利用しても問題ない って判決が出たと思うけど

          • by Anonymous Coward

            大辞林
            ① 大文字小文字数字など,同一書体で,同一の大きさの欧文活字のひとそろい。
            ② コンピューターが表示,または印刷に使う文字の形を収めたデータ。
            ③ ②により表示された文字。

            書体という意味の①③には著作権がない。データファイルという意味の②には著作権がある
            ということでしょ

            • by nim (10479) on 2017年05月12日 12時56分 (#3209559)

              > 書体という意味の①③には著作権がない。データファイルという意味の②には著作権がある
              > ということでしょ

              書体自体には著作権がないのに、データ化して文字コードで並べたものが突然「思想又は感情を創作的に表現したものであつて、文芸、学術、美術又は音楽の範囲に属する」ものになるというのは受け入れがたいな。

              販売されているフォントをそのままコピーして売るのはアウトなんだけど、
              それは著作権に由来してるの?
              著作権法じゃなくて不正競争防止法でアウトになるんじゃないの?

              親コメント
              • by nim (10479) on 2017年05月12日 13時03分 (#3209563)

                と思ったら、「プログラムの著作物」として権利を認める判例があるのね。
                うーん。そうしてみると、そもそもプログラムを著作権で守るのは私にはもともと違和感あるなあ(同じことをするプログラムは、良い書き方を突き詰めていくとひとつに収斂していくとおもうから、科学法則と同じで人間の創造性がない)
                別の方法で保護できるといいんだけど。

                親コメント
              • by Anonymous Coward

                なんだこの鬱陶しさ

                連投する気力があるんなら受け入れがたいことを受け入れられなくするようにとっとと立法措置とれる立場に立候補でもしろよ

                雑談サイト用に燃料投下にもなっちゃいねえ
                個人的感想の羅列すぎるだろ

  • by numa (4467) on 2017年05月12日 15時22分 (#3209662) ホームページ 日記
    音声合成技術の発達で、音声録音に証拠能力がなくなる。画像合成で実物と合成画像が区別できなくなったように。ということは……

    振込め詐欺も高度化するということですね。パケ写詐欺が高度化したように!
  • by Anonymous Coward on 2017年05月12日 6時28分 (#3209360)

    ガクガクブルブルって感じになるのでしょうか?

    • by Anonymous Coward

      ボカロは歌用だから、スピーチ用のこれとは直接的には競合しないはず。無理矢理しゃべらせる(通称トークロイド)ことも可能だけど、むしろ一分間のトクロ音声データでトークライブラリを制作できると考えると相補的な関係かも。ただし、今の規約には違反するから版元から新しく許諾を貰う大関門が有るけど。
      某ロイドの重音テトさんの様な、サークルや個人製作のUTAU勢なら割と早く対応するところも出てくるかも…。

      • by Anonymous Coward

        それと、喋ってる方のゆかりさんはボイスロイドと言う別のソフトウェア。こっちは今度感情表現機能がついた新バージョンが出るし、ローカルで使えるメリットもあるから、動画制作者にはやっぱりこっちの方が人気出るんじゃないかな…?

        • by Anonymous Coward

          商品ラインとしては別でも中ではライブラリの使い回しくらいはやってるだろう。
          その程度で似たような別物だろうが。

          • by Anonymous Coward

            うう…ごめんなさい。実は、元の用途が異なるせいか、ボイロとボカロはコミュニティの雰囲気とか作品作り・消費の傾向も結構差があるみたいなんだ…。だから、ボカロを高度なトークソフトに変換できるツールは、環境へ多大なインパクトを与える可能性も有るかも知れないし、そういう意味でやっぱりガクブルなのかも…。
            あと、Vocaloidは本来ヤマハの登録商標で、あまり一般化しすぎると商標の効力が無くなるって話を聞いちゃって、なんとなく遠慮しちゃってて…。昔はゲーム機はみんなファミコンと言ってたこともあったし、ネットの会話程度じゃ問題は無いのかもしれないけど…。

          • by Anonymous Coward

            VOICEROIDは似たような名前がついてるけど
            開発してるところが別の全く中身が別のものだぞ。
            (AI Talkでググレカス)
            当然ライブラリの使い回しとかありえない。

            • by Anonymous Coward
              もしかしたら元の声データ群という意味のライブラリかもしれない。
      • by Anonymous Coward

        今回の話と似たような手法だとUTAUとかCeVIOですね。

    • by Anonymous Coward

      喋らせることができるってことは歌わせることもできるだろうから、
      商売的にはガクブルですよね。
      しかもサンプリングでユーザーが好きな声を使用可能とか。
      まあそんなのが商品として出ればですけど。
      逆にメーカーとしてボーカロイド作成に活用する方向かもしれないですね。

      アニメファン声優声優ファンとしては、
      サンプリング込みのツールとして出してもらって、
      好きな声優さんを好きな漫画に好きにキャスティングできるとかやりたいですね。
      ボイスコミック自作か。
      それを音声のみで公開すると、
      誰でも該当の漫画を読みながらボイスコミック楽しめるみたいな。
      それって著作権的にどうなのよ?

    • by Anonymous Coward

      もっと残念なのは、人力の神々の技術が失わるのではないかということです。

      • by Anonymous Coward

        その辺の神業職人さんの一部はライブラリ職人に転職しちゃうかも…。

  • by Anonymous Coward on 2017年05月12日 6時31分 (#3209361)

    ローグ・ワン [imdb.com]でターキンをCGで復活させたとき、音声はどうやって作っていたんだろう。
    声質の似た人に物まねてもらったんだろうか。

  • by Anonymous Coward on 2017年05月12日 6時33分 (#3209362)

    シャロン博士のみたいだなぁ

  • by Anonymous Coward on 2017年05月12日 7時17分 (#3209374)

    http://japanese.engadget.com/2016/11/07/adobe-max-2016-adobe-max/ [engadget.com]

    Adobeの新製品と関係あるんかな。
    ていうかVocoいつ出るんだろ。

  • by Anonymous Coward on 2017年05月12日 10時21分 (#3209472)

    塩沢さんの声であ~るのTVアニメ化は可能ですか?

    # 成原博士や校長も声も必要だけど

    • by Anonymous Coward

      ペルソナのイゴールの声もお願いします。

  • by Anonymous Coward on 2017年05月12日 12時27分 (#3209541)

    チープ3DCGのアニメは、モデルもMMDでユーザーが作ってるし
    音声もクローン出来るとなればほぼ完全な同人海賊版アニメが出来る事になるなあ

    今でも音節単位で抜き出して頑張ってる動画はいくつかあるけど。

    • by eigen (34018) on 2017年05月12日 12時43分 (#3209552)
      自分もこれを思った。
      てか、声優いらなくならない?
      親コメント
      • by Anonymous Coward on 2017年05月12日 14時27分 (#3209618)

        なるほど、声の質はサンプリングでできたけど、声調は今回の技術でできるようになったから、金田朋子の声で若本節の演説をするキャラクターが作れそうってことですね

        親コメント
      • by Anonymous Coward
        声優さんの方が同じ品質でもコストが安いのです。
      • by Anonymous Coward

        たしかに、声優、アナウンサー、ナレーター、ラジオDJには影響がありそうにも見える

        ただ、これらの仕事をソフトで代用するにしても、声の調子を調整する担当者が必要になって
        必ずしも人件費の削減に直結しないのかもという気もする。
        アナウンサーの場合、番組で感想を言う部分とか、読み上げる文章のチェックをしてる部分もありそうだし。
        声優とかナレーターなら、特徴的な声・話し方・感情表現をいろいろ試行錯誤する部分もありそうだし。
        3DCGが描写としては正確なんだけど、どこか面白みに欠けるみたいなことと似た面もありそう。

        そのあたりメリット・デメリットから場面場面でどちらを使うか選ばれて棲み分けみたいなものができそうな気もする

    • by Anonymous Coward

      あえぎ声を合成できなければ意味がない

  • by Anonymous Coward on 2017年05月12日 16時59分 (#3209739)

    同じようなものありませんでしたっけ

    声のフォトショップの触れ込みで?
    サンプリング後はテキスト入力するだけで発音

    • by Anonymous Coward

      adobe が VoCo [techcrunch.com] (voice conversion) プロジェクトを昨年末に発表していますね. これは, 20分くらいの発話が必要なので, 今回の技術は1分あればいいというのが革新的なんでしょうね.

  • by Anonymous Coward on 2017年05月13日 9時33分 (#3210053)

    アルゴリズム名は「Edoya Nekohachi V」でしょうか。

    # かすりもしない

  • by Anonymous Coward on 2017年05月13日 15時38分 (#3210182)

    CHATRなんてのが昔有りまして・・・

    wikipedia:音声合成 [wikipedia.org]の項目見ると、いっぱい出てきましたな。音源とアルゴリズムの改良のお陰でしょうか。

typodupeerror

ソースを見ろ -- ある4桁UID

読み込み中...