パスワードを忘れた? アカウント作成
16257 story

歌手 「初音ミク」 ブレイク中 138

ストーリー by yoosee
これはなかなかすごい 部門より

teltel 曰く、

やじうまwatch の記事から。「初音ミク」という歌手が 8月31日から、web 上ニコニコ動画や、アマゾンで大人気になっている。 とは言っても「初音ミク」は実在の歌手ではなく、YAMAHA の開発したボーカル音源 VOCALOID2 を用いたソフトの名前。VOCALOID2 は、VOCALOID の進化版でかなり自然に日本語を発音できるそうだ。
「初音ミク」は発売元 Crypton のVocaloid2 キャラクター・ボーカル・シリーズ のひとつで、声優 藤田咲の声を元にして合成される。メロディーも簡単に入力でき、そこに日本語を重ね合わせるだけとのこと。また今後、別の人の声のサンプリングで発売が予定されている。

実際聴いてみると合成音声もついにここまで来たか、という感じだ。今後、IDOL M@STER のようなゲームと連携できるようになったら面白いかもしれない。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by Anonymous Coward on 2007年09月08日 15時04分 (#1216116)
    私は近い研究をしているので、最近たまたま、YAMAHAの研究開発関係の人と話をする機会がありました。

    その方が仰るには、
    初代VOCALOIDはあまり売れなくて、
    売れた物は、要するにアキバ系の物に多く使われていたという結果があった。
    ならば、そっちの方を向けば売れるのではないかと考え、この企画が誕生したようです。

    実際、どこかの記事によると「同種のソフトの10倍以上の売上」だとか。
    (同種のソフトが何を指すのかは不明ですが)

    これでVOCALOIDを知った人達は15kJPYというのは高いというかもしれませんが、
    音楽制作関係のパッケージソフトとしてはかなり安い方だというのも、売上を増している理由かもしれません。

    ただ、YAMAHA本体が販売元じゃないから出来たこと、とも仰ってました。
    初代VOCALOIDならまだしも、今回のはYAMAHA本体からじゃ絶対出せない(許可が降りない)ものなんだそうです。
    • by argon (3541) on 2007年09月08日 16時10分 (#1216135) 日記
      いまは、パッケージソフトそのものの市場が小さいから、コンシューマであたったのはボーナスポイントみたいなものでしょうね。

      VOCALOID シリーズは以下にまとまっていました。
      http://www.crypton.co.jp/mp/do/prod/vi/engine?id=10 [crypton.co.jp]

      (1)LEON/レオン
      モデル UKの男性プロ・シンガー
      オープンプライス税込市場予想価格¥29,400前後
      デベロッパー ZERO-G
      製品形態 音楽ソフトウエア
      カテゴリ Vocal/Choir
      収録メディア CD/CD-ROM 1枚
      リリース時期 2004年3月

      (2)LOLA/ローラ
      モデル UKの女性プロ・シンガー

      (3)MIRIAM/ミリアム
      モデル MIRIAM STOCKLEY
      オープンプライス税込市場予想価格¥34,650前後
      収録メディア CD/CD-ROM 2枚組
      リリース時期 2004年7月

      (4)MEIKO/メイコ 日本語女性ボーカル
      オープンプライス税込市場予想価格¥19,950前後
      デベロッパー CRYPTON
      収録メディア CD/CD-ROM 1枚
      リリース時期 2004年11月

      (5)KAITO/カイト 日本語男性ボーカル
      リリース時期 2006年2月

      親コメント
  • 権利関係 (スコア:3, 参考になる)

    by Anonymous Coward on 2007年09月08日 1時52分 (#1215969)
    権利関係が気になったので、ちょっと調べてみました。
    初代VOCALOIDのものですが。

    http://www.vocaloid.com/jp/technical_faq.html [vocaloid.com]
    >Q10. サンプルとして自分で作成した曲を紹介してほしいです。
    >A10. 著作権の問題等がなければ、Web上(例:ヤマハのプレイヤーズ王国)等で公開できます。

    思うに、YAMAHAは今までのシンセサイザーの延長でこの製品を扱っているような気がします。
    シンセサイザーの音色を使って作編曲し、それを販売してもYAMAHAなど音源メーカーは何も言わないわけですし、
    これもその延長であれば権利関係は心配するほどのことでも無いように思えます。
    某サブマリン特許よろしく、後で権利云々を言ってくる可能性もないわけではありませんが、
    それをやるとシリーズとしての製品が死ぬわけで、考えにくそうですし。

    となると問題は、YAMAHAと声優(あるいは事務所)がどんな契約を結んでいるかでしょうか。
    • Re:権利関係 (スコア:4, 参考になる)

      by Anonymous Coward on 2007年09月08日 2時31分 (#1215981)
      まだインストールもしてないんですが、
      内容物の使用許諾契約書(両面1枚)の合成音声の使用に関する制限によりますと
      >(長文につき意訳なので細かいツッコミは勘弁)
      >以下の形態で使用する場合は別途使用許諾契約が必要
      >・商用のカラオケ等のバックコーラス等に使用する場合
      >・合成音声のみを電話の着メロ等に、商用に使用する場合
      >・映像作品にて作品内のキャラの歌声と明らかに取れる目的で使用する場合
      >・合成音声がパートの大部分で、歌手として合成音声がメインにクレジットされた録音物等の商用リリース
      >※その他は公序良俗に反する使用を禁じる旨の記載(アレ風に言うと悪用厳禁)

      だそうです。三番目は痛いかな。動画のキャラに声をつけて遊べない・・・。
      親コメント
    • Re:権利関係 (スコア:2, 参考になる)

      by ten (14125) on 2007年09月08日 3時03分 (#1215990)
      #1215983のコメントにあるインタビュー記事 http://seiyunews.com/modules/news/article.php?storyid=1498 [seiyunews.com] に

      Q.
      > 特集サイトではよくわからなかったので教えていただきたいのですが、)著作権の扱いについて教えてください。
      > VOCALOID2で生成した音声データを同人ソフトに組み込んで利用したりはできますか?
      > また、生成した音声データを販売などはできますか?
      A.
      > 基本的に、VOCALOID 2で生成されたオリジナル・ソング(音楽作品)は、ユーザー様の名義の作品として公開/販売して頂いて問題ありません。
      > ただ、「初音ミク」や「VOCALOID」がアーティスト名そのものである場合は問題となる事があります。
      > また、公序良俗に反する歌詞は禁止されております。
      > 他にも VOCALOIDの使用許諾は、少々複雑な文言が記載されておりますが、
      > VOCALOIDに声を提供して下さった方の権利や、音声合成テクノロジーが犯罪などに使われないように保護するために必要なものなので、ご了承下さい。
      > 詳しくは弊社のサポート部門(mpsupport@crypton.co.jp)までお問い合わせていただければ幸いです。

      というやりとりがありますね。
      親コメント
  • 声優 (スコア:2, 興味深い)

    by wakatonoo2 (30019) on 2007年09月08日 0時57分 (#1215939) 日記
    コナミで昔、自由音声をしゃべらせる技術ができたけど、
    声優の声データは使えなかったと聞きます。
    (声優事務所の許可が下りなかったため)
    最近は状況は変わったのでしょうか。

    声優の仕事がなくなることはしばらく無いにしろ
    結構脅威に思われてた時代がありました
    • Re:声優 (スコア:2, 興味深い)

      by Anonymous Coward on 2007年09月08日 10時39分 (#1216051)
      折角なのでここに吊り下げます。


      実際どの程度リアルに歌い上げられるのかは、私はニコニコ動画を利用できないのでよくわかりません。
      ですが、個人的に今クリプトンが全力で取り組まなければならないのは、声のリアル化もそうですがVocaloidに歌わせることを選択することで「生身の歌い手を確保できないサビシイ人」というレッテルを貼られないような営業努力をすることにあると思っています。


      #音楽業界は全力でそういうレッテル貼り宣伝しそう。
      #根も葉もないのでAC



      /*
      MIDIのXF規格(XG+カラオケデータ)には明らかに音声合成によって「歌わせる」ことを想定しているコントロールが存在します。
      SMFによる楽曲配信は廃れて久しいですが、きちんと進化していたらXFデータに沿って、XG音源とVocaloidがきちんと連携して
      歌を作る…なんて未来像があったのかも知れません。
      まあ、歴史にifは禁物ですが。
      */

      親コメント
      • Re:声優 (スコア:2, 興味深い)

        by Anonymous Coward on 2007年09月08日 20時25分 (#1216216)
        折角なのでツッコみます。

        >Vocaloidに歌わせることを選択することで「生身の歌い手を確保できないサビシイ人」というレッテルを貼られないような営業努力をすること

        もし、(好みの声質を持つ)生身の歌い手を無償で確保できたとしても、収録にはスタジオを確保しなければならず、その予算が馬鹿になりません。(1曲録ろうと10曲録ろうと平気で数万のオーダーに達します)

        映像がFlashやCG等で、低価格に作成できるようになったように、音楽がDTM等で低価格に作成できるようになる事で、クリエイターの裾野が広がる事の方が重要なのではないかと。
        #ボーカルに使わなくても、コーラスにも使用できるのが便利なところで

        だから、完全である必要は無く、不自然さが低減されていれば、十分有用なツールだと思っています。

        小寺信良氏がITmediaのコラムで書いています [itmedia.co.jp]が、音楽業界にとって、パトロンシステムを不要にする一つの手段として有効なものだと私は思っています。
        #YAMAHAがプレイヤーズ王国を運営しているのも、その一環かもしれません。

        その上で、音楽活動が出来るようになれば、(好みの声質を持つ)生身の歌い手で収録しても遅くはないと考えます。

        >MIDIのXF規格(XG+カラオケデータ)には明らかに音声合成によって「歌わせる」ことを想定しているコントロールが存在します。

        想定しているのではなく、10年前から実際に歌わせてます [srad.jp]。
        親コメント
    • by Anonymous Coward on 2007年09月08日 14時52分 (#1216115)
      ニコニコ動画なのでIDが必要ですが、声優本人とミクに同じ歌を歌わせた比較動画 [nicovideo.jp]があるので、貼っておきます

      ミクのほうが萌え声?
      親コメント
  • by Anonymous Coward on 2007年09月08日 2時58分 (#1215989)
    もちろん以前に比べれば長足の進歩なんだが、

    ●母音はいいんだが、
    シンセでいえばアタックが遅いというか、
    子音が出るのが一瞬遅れるというか、
    そういう感じの「声」だ。
    もののけ姫の動画突っ込みのなかに「鼻声」ってのがあったが、確かにそれだ。

    人間の聴感にとってアタックってのはとても大事で、
    そのぶん騙せるだけの質の音の合成も難しいんだけど、
    ミクはそういう意味で発展途上。

    #俺たちは上り始めたばかりなんだ、この音子坂をよ。
    #YAMAHA先生の次回作にご期待ください。

    ●そのぶんを誤魔化しやすい声質として、
    ロリアニメ萌え声を持ってきた、という気がする。
    舌足らずだから発音が不味いんだよ、というような。

    せこいとも、作戦勝ちだとも、言える。

    ただ、逆にいえば、こんな歌い方が出来る人間は、
    歌の旨さというか「腹筋」が猛烈に丈夫だろうな。
    いっけんロリ声なんだが、その音程や音量の下支えが
    過剰なまでに安定している(ようなもの)なので。

    そこの君、ちょっと創造してみろ。
    身長2mの筋骨隆々たるマッチョ女声優が
    マイクのまえで萌え声演技をしてるさまを、だ…。

    ●まっすぐな声はいいんだが、ビブラートがまだちょっと、
    なんというか揺らす成分が足りないというか、なのではないか?

    生だとピッチだけじゃなく音量もフォルマントも全ての成分が
    (もともと切り分けられてるわけじゃないから引きずられていっぺんに)
    ゆれてしまい、それが「生っぽさ」になるわけだが、
    ミクも全部ゆらしているのかな?

    ●息継ぎどこよ?(^^;
    やっぱり、一息で歌える長さが異様に長い、マッチョ女声優に違いない。

    というか常に同じ力が腹にも喉にもかかってる感じだ。
    生ではそのへん適宜(それとも偶然?)変化つけつつ歌うことで
    重みを調整したりするわけだが、それが無い。

    で、そういうのを制御するパラメータも、用意されてるのかな?されてるといいな。

    #機械じゃなく自分の声(裏声)を何年も練習しまくってるのでAC
    • by Anonymous Coward on 2007年09月08日 3時27分 (#1215997)
      #1215978 [srad.jp] さんも紹介されていますが
      初代VOCALOIDの歌声も聴かれてみてはどうでしょうか?
      FF6 オペライベント 歌わせてみた(VOC@LOID ver.) [nicovideo.jp]
      少なくとも列挙されている4つの不満は、既にクリアされていることが分かると思いますよ。
      親コメント
      • by Anonymous Coward on 2007年09月08日 8時45分 (#1216027)
        それ聴きながら書いた感想なんですけど(^^;

        理想は高く持て、ってことです。
        ほんとに目指すべき(というのもなんだが)ものと比較しろってことです。
        つまり生の声と。

        あれ?聞こえませんか?
        思いっきり子音遅れてるじゃないですか。過剰にまっすぐじゃないですか。
        たしかに「ほかよりマシな演奏」ではあるだろうけど、まだまだ完全になくなってるわけじゃない。
        これを聴いていわゆる不自然だと「全く」思わない人が居たら、
        それはそれで幸せだろうとは思います。
        シンセのPianoやStringsやBrassに違和感を感じない人らと同様に、
        きっと人間の声を「聴き慣れてない」かたなのでしょうね(^^;。

        #そういやSC55なり88なりで作られた秀作を聴いて、「完璧」「そっくり」とか言ってた人らが山ほど居たっけなあ(遠い目

        ところで初代のほうが良いといってる人が居ますが、そうなんでしょうか?
        ミクはエンジンはVER2だそうなんで、
        まに受けるならば「カイゼン」されてるはずかと思います。
        あとは好み(わら)というか、
        あとおそらくプリセットな「声のくせ」を歓迎するか邪魔だと思うかの違い
        なんじゃないか?という気がするのですが、
        違いますかね?
        少なくとも私としては、紹介されてる幾つかの(つまりトップランクであろう)初代の奴より、二代目のほうがいいと思いましたね。

        ところでヤマハの技術というか「音楽力」は世界一だと大昔から感じてます。
        というのは音楽として「まともに聞こえる程ほどのところ」に落とすのが旨いんで。
        つまり例えば音源だとプリセットを素直に使うだけでソレッポク聞こえる。
        そういう意味での進化も、たぶんしてるんじゃないかな。
        親コメント
  • by KAMUI (3084) on 2007年09月08日 6時46分 (#1216015) 日記
    下ネタを(ry)

    #「No・Ri・Ko」とか思い出したヤツは、挙手 :)
  • by gm_camouf01 (31675) on 2007年09月08日 1時04分 (#1215945)
    >今後、IDOL M@STER のようなゲームと連携できるようになったら面白いかもしれない。
    IMBERとかが喋ったり?
    「リボンちゃん、萌え~」とか喋ったりすると幻滅かも…。
    #って、それはゼノグラシア [sunrise-inc.co.jp]の方!
  • by jizou (5538) on 2007年09月08日 1時14分 (#1215951) 日記
    人間の歌も、さまざまな方法で「補正」されていますからねぇ。
    極めるとこうなりそうです。
  • これがあればド音痴の俺でも自作の替え歌を
    ニコニコ動画の「歌ってみた」に投稿できそうです。やったぜ。

    それはそうと、このソフトでは使える声質が声優「藤田 咲」の声をベースとした
    一種類だけみたいですけど、今後アルゴリズムを一般化して
    ユーザー自信の声をベースに歌に合わせて勝手に歌声を作り上げてくれるソフトが
    出てくれれば良いなと思います。そうすれば極度の音痴の俺でもカラオケに行ける。

    #その前に誘ってもらえるようにしましょう。
    --
    ごめんなさい。
    • それはそうと、このソフトでは使える声質が声優「藤田 咲」の声をベースとした
      一種類だけみたいですけど、今後アルゴリズムを一般化して

      初音ミクはVOCALOIDの2代目のシリーズです。

      初代のシリーズとして、VOCALOID [crypton.co.jp]があり、こちらは5種類あります。

      ニコニコ動画で、"VOCALOID"や"VOC@LOID"のタグで公開されている物は、初代のMEIKO [crypton.co.jp]を使っている物が多いみたいです。

      初代の物としては、FF6 オペライベント 歌わせてみた(VOC@LOID ver.) [nicovideo.jp]が個人的におすすめです(w
      --
      もうちょっとなんとかなりまへんか…
      親コメント
  • 1997年ヤマハは… (スコア:1, 参考になる)

    by Anonymous Coward on 2007年09月08日 5時07分 (#1216004)
    MU100シリーズ(リンク先はMU100R) [yamaha.co.jp]用のプラグインモジュールとして、フォルマント・シンギング・プラグインボード PLG100-SG [yamaha.co.jp]があり、当時から歌わせる事が出来ていました。

    その後、ソフトウェアシンセサイザーS-YG100 [yamaha.co.jp]にも搭載されました。

    #当時、マジでMU100RにPLG100-SGを2枚挿しして、ツインボーカルなんて事を考えてたんだよなぁ

    ある意味、シンセサイザーが音色合成からサンプリングに対応していったような変化かと思います。
    最終的には、「あいうえお」の母音から全音が合成されるようになるのでしょうか。

    #この進化にもあと10年かかるのかなぁ…。
  • by tachyon (24078) on 2007年09月08日 7時19分 (#1216017)
    「この声優さんの声でこの歌をうたわせてみたい」ツリーはまだ生えてきませんか?
  • by nkitani (8256) on 2007年09月08日 8時56分 (#1216030)
    歌うパソコンもここまで来たか。感涙。
  • by Anonymous Coward on 2007年09月08日 9時56分 (#1216042)
    泣けるうちは元気 [nicovideo.jp]をボーカロイド2で打ち込んでみた。 ついでにボーカロイドのMEIKOと一緒に歌わせてみようと思って、ボーカロイド2からボーカロイドで読めるようにデータをエクスポートしてみたら何故かうまく再生できず(^_^;;; まぁ、結構お手軽に作れてかなりインターフェイスが改善されてるようです。 それと、音と音のつなぎがかなり自然になったっぽいです。

    #発売前から予約で購入したのでAC

  • by ken2 (27347) on 2007年09月08日 12時00分 (#1216069)
    以前、バットマンの映画で、俳優の演技の一部をCGに置き換えるのを制限するというのが俳優の組合で決まったとか言うのがありました(ソース不明ですすみません。現在制限も緩和されているのでしょうか?)。はじめからすべてCGなら問題にならない(できない?)ようですが。
    Vocaloidもゼロから声を作るならともかく一部声優の手を借りてるわけで、こういうやり方は声優組合で問題にならないんでしょうかね。
    # 声優はアイドル的な売り方もしているので問題になりにくいとは思いますが。
    • Re:声優の組合 (スコア:4, すばらしい洞察)

      by ryo_jp (9684) on 2007年09月08日 15時10分 (#1216119)
      声優は声を出すだけが仕事ではなく、キャラクターを感情面等で肉付けしていく面があるので、声優の仕事はなくならないと思う。
      あえて声を出すのが機械になったとしても、そこを監督や音監だけでこなすのは単に量的に言っても難しいだろう。
      親コメント
    • Re:声優の組合 (スコア:3, 参考になる)

      by Lafiell (6631) on 2007年09月08日 13時39分 (#1216097)
      同じ話かどうか判りませんが、ディスカバリーチャンネルでそう言う話を見ました。
      バットマンが超高層ビルから飛び降りて、路面にひらりと着地するシーンを「ノーカットで」CGで見せた。
      これはどんなスタントマンにも不可能な事なので、CGを使っても問題なし。
      しかし、着地したバットマンがマントを翻して歩き去る場面もCGで作っちゃった。
      それはCGキャラクターに「演技」をさせているので、役者の仕事を奪う事だと猛反発を受けて、結局そのシーンは
      劇場版ではカットされた、と言うような話でした。
      親コメント
  • by Anonymous Coward on 2007年09月08日 13時11分 (#1216085)
    いったい何を期待してるんでしょうか?

    今回のソフトは「それっぽく聞こえるのが凄い」のであって
    誰も完全な合成に成功しているとは言ってないでしょう?

    完全な合成って何ですか?
    それって必要ですか?
    それっぽく聞こえるだけで十分じゃないですか?

    こういう人たちは「CDも本物の音じゃないね」「DVDも本物の映像じゃ」
    「ipodも」とか一々ツッコミ入れながら使ってるのでしょうか?
  • 会話となるとまだまだ不自然ですが、歌であれば、そこそここの程度にそれっぽい音声合成ができるのだなぁとMEIKOを買っていじりながら思っていました。
    ピッチが音階の位置にスナップされるから、会話よりも発声のパターンが相当制限されているから、力技のサンプリングとその合成でもそれっぽく聞こえるのですかね。
    VOCALOID2 は メジャーバージョン番号が上がったって捉えていいのでしょうか。そのわりには、出力結果を聞く限りでは、あまり違いが無いような。
    あの使いにくい編集GUIが良くなったのかな。

    • by Anonymous Coward on 2007年09月08日 17時09分 (#1216145)
      喋りは難しいですよ。
      たとえば裏声を鍛えて高い声で綺麗に歌えるようになるよりも、
      高い声で綺麗に喋れるようになるほうが、数段難しい。

      あと、他所は知らないけど少なくとも日本語だと、
      音程の上下動がすごく激しく(1オクターブ以上飛ぶのもザラ)、
      しかも不味いことに日本人は大抵はそのことに無自覚なので、
      「簡単に」発声してるような気になっている。
      実は凄く難しい制御をやっているのに。

      別のところでサンプリング音源の音程連続変化の難しさを書いてる人がいるけど、
      (少なくとも日本語の)喋りでは、もろにそれが必要になってしまう。

      古代ギリシャの文献では、
      喋る言葉の音程の上下は5度(半音で7つ、周波数比でいえば2:3)以内に収まるのが良い、
      とされてたそうです。
      あっちの言語はあまり上下動を使わないみたいですね。
      ただ、そのぶん今度はアクセントというか強弱を重んじるのかも知れません。
      親コメント
  • by Anonymous Coward on 2007年09月08日 14時22分 (#1216107)
    元祖、くまうた [nicovideo.jp]の意地
typodupeerror

開いた括弧は必ず閉じる -- あるプログラマー

読み込み中...