1分間の音声から声の特徴を収集してその人のしゃべり声を任意に合成できるという技術が登場

1分間の音声から声の特徴を収集してその人のしゃべり声を任意に合成できるという技術が登場 43

ストーリー by hylom 2017年05月12日 6時00分
声優業界の危機？部門より

「1分間の音声だけでその声をコピーできる」というアルゴリズムが開発されたそうだ。カナダ・Lyrebirdが開発したもので、同社のデモページでは米トランプ大統領やオバマ前大統領、ヒラリー・クリントン氏のコピー音声による「議論」などが公開されている（Techable、The Next Web）。

この技術はまだ開発中とのことだが、将来的にはAPIを提供しさまざまなアプリケーションで利用できるようになる模様。このような技術を提供する企業は同社が初だという。

なお、この技術が裁判などで悪用される可能性については、今後音声を簡単にねつ造できるという事実が広まることで、音声は証拠能力に欠けているという風潮が広まってほしいと同社Webサイトには記されている。

この議論は賞味期限が切れたので、アーカイブ化されています。新たにコメントを付けることはできません。

記事ページを表示すべてのコメント取得

検索43コメント Log In/Create an Account

著作権問題 (スコア:3)

by ymasa (31598) on 2017年05月12日 7時40分 (#3209383) 日記

他人が作った著作物？を勝手に使ったら著作権問題になりませんかね？
私的利用しているうちは問題がないのでしょうけども。
声に関する権利は存在するのでしょうか？
https://oshiete.goo.ne.jp/qa/925550.html [goo.ne.jp]
声についても，著作権や肖像権に相当するものが認められています。
http://www.asj.gr.jp/qanda/answer/74.html [asj.gr.jp]
著作隣接権
http://www.iprchitekizaisan.com/chosakuken/rinsetsuken.html [iprchitekizaisan.com]
- Re:著作権問題 (スコア:1)
  
  by Anonymous Coward on 2017年05月12日 9時14分 (#3209422)
  
  多分著作権はない。
  （１）もし声質に著作権があるとすると、声色を真似た朗読や歌唱にまでオリジナルの朗読者や歌手の著作権が及ぶことになる。（本当にそっくりに真似るのは別。）
  しかも死後５０年も。これは創作活動に大きな支障になる。フォントに著作権が存在しないのと同趣旨。
  （２）また２つ目のリンクには
  >すなわち，放送された音声を，音声合成，音声符号化，音声認識などの研究目的に用いる場合も，許諾を得ることが必要です
  とあるけど、今の法律では著作権法４７の７にあるように、情報解析に使用することは許可されている。
  では解析の結果、再合成された音声に著作権が及ぶかといえば、全く別の言葉を喋らせるのであれば、上記の（１）から著作権は及ばないと思う。
  （ある程度長い詩や演説の朗読を、オリジナルとそっくりに合成音声で再現させるのは、著作者隣接権に引っかかるかも）。
  
  シェア
  
  親コメント
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    >フォントに著作権が存在しないのと同趣旨。
    フォントには著作権が存在します。
    書体には著作権が存在しないですが。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      テレ朝と視覚デザイン研究所の裁判ではフォントに著作権は無い＝無断で商用利用しても問題ないって判決が出たと思うけど
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        大辞林
        ① 大文字小文字数字など，同一書体で，同一の大きさの欧文活字のひとそろい。
        ② コンピューターが表示，または印刷に使う文字の形を収めたデータ。
        ③ ②により表示された文字。
        書体という意味の①③には著作権がない。データファイルという意味の②には著作権がある
        ということでしょ
        
        Re:著作権問題 (スコア:1)
        
        by nim (10479) on 2017年05月12日 12時56分 (#3209559)
        
        > 書体という意味の①③には著作権がない。データファイルという意味の②には著作権がある
        > ということでしょ
        書体自体には著作権がないのに、データ化して文字コードで並べたものが突然「思想又は感情を創作的に表現したものであつて、文芸、学術、美術又は音楽の範囲に属する」ものになるというのは受け入れがたいな。
        販売されているフォントをそのままコピーして売るのはアウトなんだけど、
        それは著作権に由来してるの？
        著作権法じゃなくて不正競争防止法でアウトになるんじゃないの？
        
        シェア
        
        親コメント
        
        Re:著作権問題 (スコア:1)
        
        by nim (10479) on 2017年05月12日 13時03分 (#3209563)
        
        と思ったら、「プログラムの著作物」として権利を認める判例があるのね。
        うーん。そうしてみると、そもそもプログラムを著作権で守るのは私にはもともと違和感あるなあ（同じことをするプログラムは、良い書き方を突き詰めていくとひとつに収斂していくとおもうから、科学法則と同じで人間の創造性がない）
        別の方法で保護できるといいんだけど。
        
        シェア
        
        親コメント
        
        Re: (スコア:0)
        
        by Anonymous Coward
        
        なんだこの鬱陶しさ
        連投する気力があるんなら受け入れがたいことを受け入れられなくするようにとっとと立法措置とれる立場に立候補でもしろよ
        雑談サイト用に燃料投下にもなっちゃいねえ
        個人的感想の羅列すぎるだろ
`証拠能力 (スコア:1)

by numa (4467) on 2017年05月12日 15時22分 (#3209662) ホームページ日記

音声合成技術の発達で、音声録音に証拠能力がなくなる。画像合成で実物と合成画像が区別できなくなったように。ということは……

振込め詐欺も高度化するということですね。パケ写詐欺が高度化したように！
某ボーカロイド (スコア:0)

by Anonymous Coward on 2017年05月12日 6時28分 (#3209360)

ガクガクブルブルって感じになるのでしょうか？
- Re: (スコア:0)
  
  by Anonymous Coward
  
  ボカロは歌用だから、スピーチ用のこれとは直接的には競合しないはず。無理矢理しゃべらせる(通称トークロイド)ことも可能だけど、むしろ一分間のトクロ音声データでトークライブラリを制作できると考えると相補的な関係かも。ただし、今の規約には違反するから版元から新しく許諾を貰う大関門が有るけど。
  某ロイドの重音テトさんの様な、サークルや個人製作のUTAU勢なら割と早く対応するところも出てくるかも…。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    それと、喋ってる方のゆかりさんはボイスロイドと言う別のソフトウェア。こっちは今度感情表現機能がついた新バージョンが出るし、ローカルで使えるメリットもあるから、動画制作者にはやっぱりこっちの方が人気出るんじゃないかな…？
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      商品ラインとしては別でも中ではライブラリの使い回しくらいはやってるだろう。
      その程度で似たような別物だろうが。
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        うう…ごめんなさい。実は、元の用途が異なるせいか、ボイロとボカロはコミュニティの雰囲気とか作品作り・消費の傾向も結構差があるみたいなんだ…。だから、ボカロを高度なトークソフトに変換できるツールは、環境へ多大なインパクトを与える可能性も有るかも知れないし、そういう意味でやっぱりガクブルなのかも…。
        あと、Vocaloidは本来ヤマハの登録商標で、あまり一般化しすぎると商標の効力が無くなるって話を聞いちゃって、なんとなく遠慮しちゃってて…。昔はゲーム機はみんなファミコンと言ってたこともあったし、ネットの会話程度じゃ問題は無いのかもしれないけど…。
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        VOICEROIDは似たような名前がついてるけど
        開発してるところが別の全く中身が別のものだぞ。
        (AI Talkでググレカス)
        当然ライブラリの使い回しとかありえない。
        
        Re: (スコア:0)
        
        by Anonymous Coward
        
        もしかしたら元の声データ群という意味のライブラリかもしれない。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    今回の話と似たような手法だとUTAUとかCeVIOですね。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  喋らせることができるってことは歌わせることもできるだろうから、
  商売的にはガクブルですよね。
  しかもサンプリングでユーザーが好きな声を使用可能とか。
  まあそんなのが商品として出ればですけど。
  逆にメーカーとしてボーカロイド作成に活用する方向かもしれないですね。
  アニメファン声優声優ファンとしては、
  サンプリング込みのツールとして出してもらって、
  好きな声優さんを好きな漫画に好きにキャスティングできるとかやりたいですね。
  ボイスコミック自作か。
  それを音声のみで公開すると、
  誰でも該当の漫画を読みながらボイスコミック楽しめるみたいな。
  それって著作権的にどうなのよ？
- Re: (スコア:0)
  
  by Anonymous Coward
  
  もっと残念なのは、人力の神々の技術が失わるのではないかということです。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    その辺の神業職人さんの一部はライブラリ職人に転職しちゃうかも…。
そういえば (スコア:0)

by Anonymous Coward on 2017年05月12日 6時31分 (#3209361)

ローグ・ワン [imdb.com]でターキンをCGで復活させたとき、音声はどうやって作っていたんだろう。
声質の似た人に物まねてもらったんだろうか。
- Re:そういえば (スコア:1)
  
  by ukenerai (36532) on 2017年05月12日 15時20分 (#3209661) 日記
  
  山田康雄→栗田貫一のような事例もなくなるんでしょうか。
  
  --
  -- う～ん、バッドノウハウ？
  
  シェア
  
  親コメント
  - Re:そういえば (スコア:1)
    
    by bunmei (23386) on 2017年05月12日 16時09分 (#3209700)
    
    メカ広川太一郎とかできないもんかしら山賊のお頭。
    
    シェア
    
    親コメント
宇宙兄弟 (スコア:0)

by Anonymous Coward on 2017年05月12日 6時33分 (#3209362)

シャロン博士のみたいだなぁ
- Re: (スコア:0)
  
  by Anonymous Coward
  
  ミッションインポッシブルを連想しました。スパイ大作戦の方も見えるでしょうし。007の人も居るでしょうね。
  - Re:宇宙兄弟 (スコア:2)
    
    by hinatan (24342) on 2017年05月12日 11時44分 (#3209525) 日記
    
    私はターミネーター
    
    シェア
    
    親コメント
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      TNGのデータ少佐も声紋を複製して、航宙艦を乗っ取るくらいはできるみたいですね。
      たぶん第77話「永遠の絆」。 http://www2u.biglobe.ne.jp/~mayuzumi/startrek/tng_guide/4th/epi077.html [biglobe.ne.jp]
      あー、そういえばこれが正に「兄弟」の話だった。（原題が"Brothers")
- Re: (スコア:0)
  
  by Anonymous Coward
  
  まず、ホーキングでしょう
  普通は
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    ひどいネタバレを見た…
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      みんな知ってるよ
Adobe (スコア:0)

by Anonymous Coward on 2017年05月12日 7時17分 (#3209374)

http://japanese.engadget.com/2016/11/07/adobe-max-2016-adobe-max/ [engadget.com]
Adobeの新製品と関係あるんかな。
ていうかVocoいつ出るんだろ。
この技術を使って (スコア:0)

by Anonymous Coward on 2017年05月12日 10時21分 (#3209472)

塩沢さんの声であ～るのTVアニメ化は可能ですか?
# 成原博士や校長も声も必要だけど
- Re: (スコア:0)
  
  by Anonymous Coward
  
  ペルソナのイゴールの声もお願いします。
けものフレンズとか (スコア:0)

by Anonymous Coward on 2017年05月12日 12時27分 (#3209541)

チープ3DCGのアニメは、モデルもMMDでユーザーが作ってるし
音声もクローン出来るとなればほぼ完全な同人海賊版アニメが出来る事になるなあ
今でも音節単位で抜き出して頑張ってる動画はいくつかあるけど。
- Re:けものフレンズとか (スコア:2)
  
  by eigen (34018) on 2017年05月12日 12時43分 (#3209552)
  
  自分もこれを思った。
  てか、声優いらなくならない？
  
  シェア
  
  親コメント
  - Re:けものフレンズとか (スコア:1)
    
    by Anonymous Coward on 2017年05月12日 14時27分 (#3209618)
    
    なるほど、声の質はサンプリングでできたけど、声調は今回の技術でできるようになったから、金田朋子の声で若本節の演説をするキャラクターが作れそうってことですね
    
    シェア
    
    親コメント
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    声優さんの方が同じ品質でもコストが安いのです。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    たしかに、声優、アナウンサー、ナレーター、ラジオＤＪには影響がありそうにも見える
    ただ、これらの仕事をソフトで代用するにしても、声の調子を調整する担当者が必要になって
    必ずしも人件費の削減に直結しないのかもという気もする。
    アナウンサーの場合、番組で感想を言う部分とか、読み上げる文章のチェックをしてる部分もありそうだし。
    声優とかナレーターなら、特徴的な声・話し方・感情表現をいろいろ試行錯誤する部分もありそうだし。
    ３ＤＣＧが描写としては正確なんだけど、どこか面白みに欠けるみたいなことと似た面もありそう。
    そのあたりメリット・デメリットから場面場面でどちらを使うか選ばれて棲み分けみたいなものができそうな気もする
- Re: (スコア:0)
  
  by Anonymous Coward
  
  あえぎ声を合成できなければ意味がない
1、２年くらい前にも・・・ (スコア:0)

by Anonymous Coward on 2017年05月12日 16時59分 (#3209739)

同じようなものありませんでしたっけ
声のフォトショップの触れ込みで？
サンプリング後はテキスト入力するだけで発音
- VoCo (スコア:0)
  
  by Anonymous Coward
  
  adobe が VoCo [techcrunch.com] (voice conversion) プロジェクトを昨年末に発表していますね. これは, 20分くらいの発話が必要なので, 今回の技術は1分あればいいというのが革新的なんでしょうね.
アルゴリズム名は (スコア:0)

by Anonymous Coward on 2017年05月13日 9時33分 (#3210053)

アルゴリズム名は「Edoya Nekohachi V」でしょうか。
# かすりもしない
マルチランゲージ音声合成システム (スコア:0)

by Anonymous Coward on 2017年05月13日 15時38分 (#3210182)

CHATRなんてのが昔有りまして・・・
wikipedia:音声合成 [wikipedia.org]の項目見ると、いっぱい出てきましたな。音源とアルゴリズムの改良のお陰でしょうか。

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

1分間の音声から声の特徴を収集してその人のしゃべり声を任意に合成できるという技術が登場 More ログイン

著作権問題 (スコア:3)

Re:著作権問題 (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re:著作権問題 (スコア:1)

Re:著作権問題 (スコア:1)

Re: (スコア:0)

`証拠能力 (スコア:1)

某ボーカロイド (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

そういえば (スコア:0)

Re:そういえば (スコア:1)

Re:そういえば (スコア:1)

宇宙兄弟 (スコア:0)

Re: (スコア:0)

Re:宇宙兄弟 (スコア:2)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Adobe (スコア:0)

この技術を使って (スコア:0)

Re: (スコア:0)

けものフレンズとか (スコア:0)

Re:けものフレンズとか (スコア:2)

Re:けものフレンズとか (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

1、２年くらい前にも・・・ (スコア:0)

VoCo (スコア:0)

アルゴリズム名は (スコア:0)

マルチランゲージ音声合成システム (スコア:0)