パスワードを忘れた? アカウント作成
13370618 story
Sony

ソニーがテキスト原稿をモーション付きで読み上げられる「バーチャルアナウンサー」を開発 36

ストーリー by hylom
歴代バーチャルアナウンサー/バーチャルアイドルを集めてみたい 部門より

ソニーが、テキスト原稿を読み上げることのできる「バーチャルアナウンサー」を開発した(AV Watch)。この技術を使った「アバターエージェントサービス」を共同通信デジタルとともに提供するという。

テキスト原稿を自然な音声に変換するとともに、CGで作成したキャラクターのモーションを自動生成し、音声付き動画を作成できるという技術。音声は声優の寿美菜子さんが担当。キャラクターデザインは「ソードアート オンライン」のキャラクターデザインなどを手がけた足立慎吾氏によるもの。キャラクターの動きや背景などの変更と言ったカスタマイズもできるという。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by akiraani (24305) on 2017年08月05日 15時05分 (#3256534) 日記

    とりあえず知ってる限りのものを時系列順に。
    多分、他にもいろいろあるとは思う。

    ・ニコニコニュースメーカー
    ニュース番組作れる「ニコニコニュースメーカー」公開 [itmedia.co.jp]
    →2008年公開。ニュースキャスター風のキャラクターがニュース原稿を読み上げるニュース番組風の動画を作成できるツール。現在は公開終了している。

    ・T2V Player
    CGアニメが30秒で作れる無料ソフト、T2Vプレイヤー [ascii.jp]
    →2009年公開のニュース風番組動画作成ツール。ニコニコニュースメーカーと似た感じのソフト。プリセットキャラクターの数が八種類あり、簡単なアクションをスクリプトで記述することができた。現在は公開終了している。

    ・MMDAgent
    初音ミクとおしゃべりできる音声インタラクション構築ツールキット [it.srad.jp]
    →2010年発表。名工大開発の音声インタラクションシステム構築ツールキット。音声認識(Julius)と合成音声(Open JTalk)を組み合わせて3DCGのモデルを連動して動かすことができる。名工大のキャンパスで外来者案内のデジタルサイネージが現役稼働中。

    ・杏梨ルネ
    フジテレビ、江川達也デザインのCGキャラを女子アナに採用 [srad.jp]
    →2012年にフジテレビで発表された合成音声のCGアナウンサーのアバター。アナウンサーとしては一年持たず、翌年5月にほとんど別キャラになって歌声専門のVOCALOIDとしてアイドルに転向するという発表 [srad.jp]があったが、それ以降音沙汰なし。

    ・CeVIO Vision
    ボカロじゃない音声合成ソフト「CeVIO」ってなんぞ!? [ascii.jp]
    →MMDAgentをベースに拡張したシステム。2013年1月より秋葉原アニメイトでデジタルサイネージとして展示されていた。声のベースは後に声優の水瀬いのりだと判明。合成音声ソフトのみ一般販売されているが、アバター連動機能はない。CeVIO Vision自体はたまにイベントに展示されることがあるらしい。

    ・Pepper
    ソフトバンクが人型ロボット「Pepper」を発表 [srad.jp]
    →2014年発表。ソフトバンクの開発した接客ロボ。人工知能搭載でリアルタイムに音声を合成して受け答えができる。音声合成エンジンはエーアイ社のAItalkを使用。VOICEROID+ 民安ともえに似ている、という話はあるものの公式情報がないため真偽は不明。声優としてディズニー映画「ベイマックス」 に出演 [impress.co.jp]している。

    • by Anonymous Coward

      伊達杏子を忘れるな

      • by Anonymous Coward

        杏子さんは時代が早すぎたんや。。。

    • by Anonymous Coward

      もう誰も覚えちゃいないだろうが、その昔にTVMLってのをNHKが作っててな。
      Windows95の時代に3Dムービーメーカーってプリプロを作るようなソフトが流行って、それとHTMLブームの影響を受けたようなものだった。
      番組自動生成ソフトとして知ってるのはこれが最古かな。

  • by Anonymous Coward on 2017年08月05日 8時38分 (#3256374)

    ニュース読み上げサービスとかアプリとか、忘れた頃に表れて、気が付けば消えていたりする。

    • by Anonymous Coward on 2017年08月05日 8時40分 (#3256376)

      昔、『葛城ミサト報道計画』なんてのがあったねえ。他にも似て非なるものは多かったな。デスクトップアプリでアニメ調のキャラがRSSを読み上げるなんてのも何種類かあるしね。

      親コメント
    • by YHP (46365) on 2017年08月05日 9時22分 (#3256383)
      杏梨ルネというのもありましたね
      親コメント
    • by Anonymous Coward
      次に来るのは、複数のキャラクターが入り乱れて、脚本を入力するとアニメドラマを演じるのです。
      ユーザーによる脚本の書き換えも可能で、18禁にも対応
      • by Anonymous Coward

        セクハラ対応ですねわかります

    • by Anonymous Coward

      ニュース読み上げで最初に思いつくのが MAX HEADROOM だったりするお年頃

    • by Anonymous Coward

      その昔にも90年代にもNHKがスクリプトで動かす奴作ってたよな
      こういうバーチャルキャラで何かを~って、誰もが考えついてほとんど成功例がないんだよな

      しかも、Live2D使うのかよ…ソニーはMotionPortraitって自社技術あったのにもったいない

  • by Anonymous Coward on 2017年08月05日 9時28分 (#3256384)

    目覚ましマネージャーの系譜ですかね。

    • by Anonymous Coward

      最高の二次元嫁を作りたいだけのGeekが、会社からどうしてもマネタイズしろと云われてやった仕事な予感

      でないとこんな素晴らしいクオリティに仕上がるわけがない

    • by Anonymous Coward

      ああゆうのって事前に用意されたパターン見尽くすと、急に飽きるんですよねえ。

  • by Anonymous Coward on 2017年08月05日 10時07分 (#3256390)

    なんかこう、もうちょっとマシになるもんじゃないの?

    合成音声も結構聞けるようになってきたイメージあったけど、
    ああいうのは人手で目一杯調整した奴なのかな

    どっかがDeepLearningとかでなんかやってなかったっけ
    結局、単純に自動合成しただけだとまだまだこんなもんなのか

    • by Anonymous Coward

      人間っぽさと聴きやすさは排他なんじゃね?
      いじり過ぎるよりゆっくりのほうが何言ってるか分かるみたいな

      • by Anonymous Coward

        そんなことないでしょ。
        はっきり言わせてもらえば聞いてるのが苦痛になるレベルで不自然だけど。

        • by Anonymous Coward on 2017年08月05日 13時13分 (#3256471)

          人間だったら、相性によって聞いてるのが苦痛になるレベルとなるのが存在しないかといえばそーじゃないだろ。

          親コメント
  • by Anonymous Coward on 2017年08月05日 11時02分 (#3256410)

    これ中身、というかエンジンは音声合成 CeVIO + 映像 Live2D あたりじゃないの?
    目覚ましマネージャも音声認識やら音声合成やらのエンジンは独自ではないでしょ。

    • by Anonymous Coward on 2017年08月05日 14時25分 (#3256509)

      おしい
      CG生成ライブラリはLive2D [live2d.com]だが
      音声合成エンジンはToSpeak G3 [semicon-storage.com]

      モノづくりのソニーが頑張ったのは
      ソニーエージェントテクノロジーとのことで
      SmartBand Talkの流用みたいです
      http://avataragentservice.jp/ [avataragentservice.jp]

      ソニーエージェントテクノロジーは、ボイスインタラクション(音声対話)などの様々な入出力を通じて、ユーザーに有用な情報を提供するためのソニーの自社開発技術です。ソニーモバイルコミュニケーションズ株式会社の「Xperia Ear」「Xperia Touch」、株式会社ソニー・ミュージックコミュニケーションズの「めざましマネージャーアスナ」「一択彼女 加藤恵」など、音声対話機能を持つ製品、アプリケーションに採用されています。

      めざましマネージャーの技術 [wikipedia.org]
      音声認識 - Google音声入力
      意図理解・対話生成 - 「SmartBand Talk SWR30」
      発話:ToSpeak G3 [semicon-storage.com]
      画面表示:Live2D [live2d.com]

      SmartBand Talk [sonymobile.co.jp]
      Xperiaと連携し、身につけるだけで体の動きだけでなく、ライフスタイルすべてを記録する ウェアラブルデバイスです。
      さらにSmartBand Talkなら手元でのハンズフリー通話やボイスコントロール※ができます。
      ライフログや時刻は常時表示の電子ペーパーでひと目でいつでも確認できます。手元から、まいにちを軽快に。

      # 鳴かず飛ばずのウェアラブルデバイスにかけた費用回収のため更に。。。

      親コメント
    • by Anonymous Coward

      iPhoneは既存の技術の組み合わせでちっとも凄くないみたいな批判と同じに聞こえる
      儲かる技術を開発するのが一番凄いが、世の中は儲かる製品(サービス)を開発するのを目的とした企業が大半ですよ

      これが売れるのかは知らんけど

      • by Anonymous Coward

        この場合は既存の技術の組み合わせで既存のものを作ったようにしか見えないので。
        (そういえば杏梨ルネってのもいたな・・)

        #実戦空手道とブーメランを組み合わせて全く新しい格闘技を作るくらいのインパクトが欲しい

    • by Anonymous Coward

      そのへんの技術情報はストーリーソースに書いてあるよ。

  • by Anonymous Coward on 2017年08月05日 13時52分 (#3256491)

    森田美由紀が19時のニュース読んでた時代に、テキストを流暢に読み上げるシステム作ってたよな。
    あれどうなったんだよ?
    nhkでも紹介されないけど。
    森田美由紀の時代だから結構昔だけど、読み上げの完成度かなり高かった感じだけど。

    • by Anonymous Coward

      もう売ってないけど2000年くらいにオムロンが販売してた「SMART TALK」はかなり聞き取りやすい自然な読み上げを実現してた。
      今もそれより良いのが出ないのでそれを使ってる。一太郎のプレミアムパックに入ってる読み上げ機能に入ってるのがオムロン製のそれだったかな。

      • by Anonymous Coward

        実際にTV番組で使われてるのではテレビ東京の「モヤモヤさまぁ〜ず2」のがなかなかの出来
        はじめは生身のナレーターがわざとおかしな調子でしゃべってると思ってた

  • by Anonymous Coward on 2017年08月05日 14時08分 (#3256498)

    選択肢の一つとしてあるのはいいけど、ビジネスユースを狙ってるんならもうちょっとリアル系のイラストも必要なんじゃないの。
    アニメ絵ってだけで選択肢から外れるTPOだってあるでしょ。

    • by Anonymous Coward

      最近はアニメ絵かそうでないかを区別して過剰反応するのはアニオタだけらしいぞ

      普通の人はもう意識すらせず、普通の漫画調イラストと同じように受け入れてるっぽい

    • by Anonymous Coward

      キズナアイとかすごい人気やん?

      どっちかつーと地味子なのがダメだと思う

    • by Anonymous Coward

      CGモデルを変えるとなるとモーション変更とかカメラワーク調整も必要だろうから、そこは要相談でしょうね。

    • by Anonymous Coward

      町中にあるポスターの絵を見てみて下さい。
      その商店街だけで使える商品券だろうと自衛官募集だろうと、アニメ絵/漫画絵/萌え絵で無いものを探すのが困難です。
      サルまんで予言されていた未来が本当に来てしまったのです。

      それに、ビジネスニュースやNHKの19時のニュースでも女子アナウンサーには華を求めるんだから、そんなに違いはないかと。

    • by Anonymous Coward

      不気味の谷の手前で留まるのも、立派な技術的・営業的判断だと思うが。

    • by Anonymous Coward

      そもそもビジネスユースだと音声だけでいいような
      モーション必要?

  • 天気予報とか株式債券市況程度なら既に行われているだろうが、更に実績を積めば、時間を浪費して放送すべきニュースを局限し放送しない自由の名目となってる、バカなコメンテーターも不要となる。
    結果、ニュース・バラエティー(時事ニュースを扱わないのは稀)番組の情報密度が濃くなり、報道の公平化が進めば、いいなあ。

typodupeerror

目玉の数さえ十分あれば、どんなバグも深刻ではない -- Eric Raymond

読み込み中...