アカウント名:
パスワード:
たぶん仮想ボーカルソフトにおいても、人間様の喉とかにセンサを大量につけて、そしてソフト側でその入力を解釈できるように作ってあれば、「すごくリアルな」声を出せるんじゃないかと思います。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
人生unstable -- あるハッカー
サンプリングの現場風景 (スコア:0)
今回のはどうだったのだろうか?
Re:サンプリングの現場風景 (スコア:3, 参考になる)
まあ,楽ではないでしょうなあ。
Re:サンプリングの現場風景 (スコア:1)
必ずしも歌の強弱は音量の大小ではないので、これを再現するために
声優さんはさらに大変に・・
でもいつか実現しないかなぁ。
強弱は難しい (スコア:1, 参考になる)
たとえばピアノの音なら、ハンマーが弦にぶつかる速度が唯一の変数になるため、力技で(サンプル数を増やして)強弱表現を網羅していくことも可能でしょう(というか現にやっています)が、ここにペダルが絡んでくると必要なサンプル数が一気に増えます。それでも、ペダルの踏み方が一定であればまだマシですが、踏み方を任意に変更可能にしようとするとエラいことになります。
同様の事情で、擦弦楽器や声楽の強弱表現をサンプリングデータで表現するのはかなり困難です。多分、弱い発音
Re:強弱は難しい (スコア:2, 参考になる)
最近のは凄いですね。
PCにメモリ&HDDが潤沢なのをいいことに、
ピアノ音色一丁で数十ギガバイト、なんてなデータも売ってる。
>ペダルが絡んでくると必要なサンプル数が一気に増えます。
ピアノのペダルな音の発音原理から考えると
(原理で考えるのはサンプリングの立場から見れば既にオフトピですが)
ペダルはサンプリングで対処するんじゃなく、
「そういう独特な性質を持った特殊なリバーブ」
として実装するのが理想ではないか?と思っています。
思ってるだけで実行したことはないですが…。
ペダル踏んだ状態でピアノの上(中?)で例えば拍手をすると、
独特の音の響き方が残ります。
たぶんあれがペダルの音の本質。
#そういえばペダル踏んでから最高音を強打すると、
#たいていのグランドでは単にドの音が鳴るだけだけど、
#たいていのアップライトでは打鍵ノイズが吸収しきれてないのか、
#ホワイトノイズっぽい音が弦に響き渡りますね。
それに限らず本当はピアノの全てを
モデリング音源で作るほうが良いんだろうと思っています。
http://www.minet.jp/pianoteq/pianoteq/ [minet.jp]
のような商品も既にありますし。
こいつのペダルとかの表現はそれこそ秀逸だと思います。
(ただ、逆になんでもない音が妙に変なときもあるので、これまた発展途上ですが)
>音高も変化するような場合
ギターなどのスライド奏法は、サンプリングだと悲惨ですね。
>ハイハットロールをしながらペダルの踏み具合を連続的に変え打点もカップ方向にずらしていく
シーケンサのさらに邪道な使い方として、
つまりシーケンサを使った音作りとは呼べないかも知れませんが、
入力デバイスを人間が演奏する(それをシーケンサは記録する)っていうのがありますね。
そして、打点をずらすなどといったパラメータを(リアルタイムに)「演奏」できるデバイスは、一応色々売ってますね。普通のドラムスと概ね同じ形状をした電子ドラムスもそれですし、昔のRolandにたしかスライドパッドつきドラムマシンがあったような。他にもスライドパッドつき機材は最近色々あるんで、それをいじればなんとかなりそう。
人間演奏のメリットは「よきに計らって」くれるところですね。
(スキルある演奏者が)音源と入力デバイスに数分ないし数時間かけて慣れれば、
「入力の加減」と「音の変化」の相関を(体が)覚えて、
音から演奏にフィードバック出来るようになるんで、
ほっといても「非リアルな部分を包み隠すような演奏」をするようになります。
(演奏者にとって快適かどうかは別ですが)
たぶん仮想ボーカルソフトにおいても、
人間様の喉とかにセンサを大量につけて、
そしてソフト側でその入力を解釈できるように作ってあれば、
「すごくリアルな」声を出せるんじゃないかと思います。
グラデーションとデジタルとの相性そのものは、
そんなに心配しなくても良いんじゃないかと思っています。
上記のようにスライドパッドや喉センサから取り込んだデータだって「デジタル」なのですから。
問題はそのデータが
●十分細かいか。
●出音に合わせてフィードバックして加減してるかどうか。
が問題なのだろうと思います。
(十分手の込んだデジタルデータはアナログと区別がつかない。)
ちなみにVOCALOIDのような商品で気がかりなのは、
音源部と入力部がいわば「抱き合わせ」になってるという点です。
片方づつ評価したほうが本当は厳密で公平(?)な評価を出来るのでしょうけど、
両方まとめた評価だと、味気ないのが音源のせいなのか入力(を細かくしづらい)のせいなのかがわかり難い。
電気通信科学館の声モデル (スコア:3, 参考になる)
声帯の音から、喉を通って、口の中で加工されて・・など何段階かの音の変化を示して、最初の声帯では「ブーブー」だったのが、だんだんと声になっていくのを音付きで展示していました。
そういう声のモデリングというか、全ての音は倍音で表現できるというFM音源みたいに、ごくごく簡単なパラメータで表せるような気もします。
FM音源も非整数倍の倍音に弱かったり(こういった音は自然界には意外多い)、声も言語によって母音が21個もある韓国語 [biglobe.ne.jp]、3個しかないアラビア語 [hakusuisha.co.jp]など、それを母国語とする人の処理に依存する部分があって難しいという考えと、情報の欠落が内耳から大脳のどこかで捏造された情報により補間されていることになる。このような機能があるこそ、携帯電話のcodecやMP3のような手抜き技術が成り立つ [coara.or.jp]など簡単に表せるのではないかと考えたり、奥が深いです。
Re:強弱は難しい (スコア:0)