朝日新聞社メディアラボ、機械学習モデルが自動生成したフィクション記事を公開

朝日新聞社メディアラボ、機械学習モデルが自動生成したフィクション記事を公開 34

ストーリー by nagazou 2020年11月21日 6時05分
まれに本物な記事が出たりしそう部門より

11月18日に、朝日新聞の一部門で新規ビジネスの開発などを行っている朝日新聞社メディアラボは「♯この記事は実在しません」という技術デモを発表した。この技術デモは、機械学習を利用して自動的に記事を生成する試みで、ページをリロードするごとに自然な、しかし実際には存在していない記事を自動的に生成することができる。

この記事は実在しませんでは、人間の話す文章の構造などを定式化する言語モデルを用いて作成された。朝日新聞には過去30年にわたって蓄積してきた記事データがあることから、これを元にして言語モデルを生成したという。文章生成にはOpenAIが開発したキスト生成モデル「GPT-2」が使用されているとのこと。

この記事は実在しません以外にも、日本語データのみから作られた言語モデルを使用して海外のことわざを再構成した「[穴埋め式]世界ことわざ辞典」というものも存在している模様（[穴埋め式]世界ことわざ辞典[PDF]）。

この議論は賞味期限が切れたので、アーカイブ化されています。新たにコメントを付けることはできません。

記事ページを表示すべてのコメント取得

検索34コメント Log In/Create an Account

イマイチ (スコア:0)

by Anonymous Coward on 2020年11月21日 6時20分 (#3928240)

GPT-2は前評判はよかったけど、チューニングがいまいちなのか日本語に適していないのか、まだまだ不自然ですね。
- 機械学習モデルが自動生成したフィクション記事 (スコア:0)
  
  by Anonymous Coward
  
  つまりは、取材や自動収集した（朝日新聞社が事実と認める）情報から自動生成した、試記事としてすら公表できる水準にないって事。
  朝日新聞では、通信社や記者（日本人とは限らない）とデスクの間の編集者が、自然な日本語記事に仕上げて来る位には優秀だから、その目には適わなかったのだろう。
  - Re:機械学習モデルが自動生成したフィクション記事 (スコア:1)
    
    by Anonymous Coward on 2020年11月21日 7時08分 (#3928249)
    
    (朝日新聞にとって)「政治的に正しくない」記事が生成されてしまう問題が解決できなかったとか
    
    シェア
    
    親コメント
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      Microsoft「うっ頭が」
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    > （朝日新聞社が事実と認める）情報
    　
    だからフィクション記事なんですね。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  チューニングにウィキペディア日本語版を使っている時点でお察し。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    無料デモなんだから、この程度にしとかないとな。
てっきり (スコア:0)

by Anonymous Coward on 2020年11月21日 6時31分 (#3928241)

取材メモ的な情報を与えたら記事にまとめてくれる奴かと思ったら違った。作る文章が「記事」である必要があるのだろうか。
記事文の裏付けチェックとかコンプラチェックとかしてくれるAIの方がずっと必要とされているんじゃなかろうか。
- Re:てっきり (スコア:1)
  
  by Anonymous Coward on 2020年11月21日 7時24分 (#3928257)
  
  GPTシリーズは1からN番目までの単語を見て、N+1番目の単語を勘で推測するシステム
  ネットの書き込みとかで勘を鍛えると意外と簡単な受け答えが書けたりする
  でも「この後に続く文はズバリ何だと思う?」という質問にしか答えてくれないので
  自然で滑らかな文章を無限に生成することはできても正確な情報は扱えないんだよね
  確かに「検索エンジンとして応用できるのでは?」という提案は見かけたかな
  
  シェア
  
  親コメント
記事というより... (スコア:0)

by Anonymous Coward on 2020年11月21日 6時42分 (#3928243)

何度か試してみたけどWikipediaの概要風な文章が出力されたんだけど。
これ記事じゃなくない？
- Re: (スコア:0)
  
  by Anonymous Coward
  
  記事というよりは、記事の最後についている人物プロフィールとか用語についての解説だね。
  事件記事についても出力できるようにもできるのかもしれないが、
  内容によって架空でも人権侵害になったり、凄惨な内容の記事が出力されかねないから抑制しているのかも。
なかなか良い (スコア:0)

by Anonymous Coward on 2020年11月21日 6時50分 (#3928245)

これまでも日本語文章を自動生成させようとする試みはあったけど、ヒジョーにイマイチな結果に止まっていた。それらと比較すると、これは大きな進歩を感じる。
- 虚構新聞にはまだ遠い (スコア:0)
  
  by Anonymous Coward
  
  まだ短信レベルだからなあ。それでも取りあえず読める、みたいなものが出てくるのはなかなか。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    天声人語ぐらいなら出てくるんじゃね。
    人間(朝日新聞の論説委員)が書いても要約しづらいから自動生成でも変わらん。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      AIの書いた記事から「筆者の心情を述べよ」という入試問題ができる時代が来るのか
- Re: (スコア:0)
  
  by Anonymous Coward
  
  > それらと比較すると、これは大きな進歩を感じる。
  いや、このシステムが進歩したんじゃなくて、それを進歩かどうかを判断する人間が大きく劣化しただけだと思うよ。
  「#この記事は実在しません」を幾つか読んだけど、得体の知れない言葉使いや内容の論理破綻が目に付くものだった。機械が書いた文章かどうかは分からないが、少なくともマトモな教育を受けた人間が書いた文章ではない、というのは分かった。
  まあ、「#この記事は実在しません」レベルの文章を書く人間は少なくないのが実相だから、世の中の状態に合わせたシステムなのかな、とも思う。
ところで (スコア:0, すばらしい洞察)

by Anonymous Coward on 2020年11月21日 7時39分 (#3928261)

性奴隷慰安婦は実在しませんの反省記事を一生作成してろよ
- Re: (スコア:0)
  
  by Anonymous Coward
  
  サンゴに刻みつけたるわ
- Re: (スコア:0, 参考になる)
  
  by Anonymous Coward
  
  慰安婦報道が捏造であると言ってOKとの最高裁の判断が出ましたね。
  　
  https://www.asahi.com/articles/ASNCM6HHQNCMUTIL02Z.html [asahi.com]
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    慰安婦に関する記事を捏造だと指摘したのは名誉毀損に当たるどうかを争った裁判だから、
    問題となった記事は捏造と言っても名誉毀損には当たらないという相当の理由はあったんでしょう。
    上村さんも桜井さんもジャーナリストだから問題の記事が事実かどうかについては争えたのかなぁと。
    それを
    　> 慰安婦報道が捏造であると言ってOKとの最高裁の判断が出ましたね。
    と、全ての報道について拡大解釈するのはどうなんでしょう。
    他の慰安婦関連の記事を何の根拠もなく捏造だと言ったら名誉毀損が認められるかもしれないわけで。
- 海外のことわざを再構成した「[穴埋め式]世界ことわざ辞典」というものも存在している模様 (スコア:0)
  
  by Anonymous Coward
  
  当然「泣く子は餅を一つ多くもらえる」は入っているべき。
  https://dic.nicovideo.jp/a/%E6%B3%A3%E3%81%8F%E5%AD%90%E3%81%AF%E3%82%... [nicovideo.jp]
- Re: (スコア:0)
  
  by Anonymous Coward
  
  性奴隷慰安婦は実在しませんの反省記事を一生作成してろよ
  ①慰安婦は実在した→なので安倍首相が韓国と話を付けた
  ※安倍さん難しい問題の落としどころに頑張った
  ※ただその後の韓国側の諸々の言動は大変腹立たしいしかしそれが慰安婦の実在を否定する理由にはならない
  ②強制連行だったがどうかが論点になった→朝日新聞の報道の根拠に問題があり朝日は以前謝罪訂正した
  ※なお今回の裁判はこれら事実関係が論点になったものではなく櫻井よしこ先生のお気持が論点で櫻井さんの勝ち
  ③朝日新聞が性奴隷と報道したことはあったっけ
  ここらへんを整理しないといつまでもフェイクや粘着が沸いてきてうざいですねぇ(まぁ放置してもいいけど)
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    > ここらへんを整理しないと
    　
    とぼけてないで、最高裁が認めた櫻井よしこ氏の記事読めばいいじゃん。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      > 最高裁が認めた櫻井よしこ氏の記事
      正確には、櫻井よしこ氏が正しいと信じるのも妥当と考える根拠があったですね。
      記事の内容が正しいと認定してるわけではない。
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        くやしいのぅw
- Re: (スコア:0)
  
  by Anonymous Coward
  
  原発誤報もなー
え、みせちゃっていいの？ (スコア:0)

by Anonymous Coward on 2020年11月21日 11時44分 (#3928384)

朝日の秘密を見せてよかったの？
- Re: (スコア:0)
  
  by Anonymous Coward
  
  中に人が入っている方が秘密なんで
新聞社が実際には在りもしないニュース記事書いて、一体どうするのかな？ (スコア:0)

by Anonymous Coward on 2020年11月21日 11時59分 (#3928396)

捏造と創作の区別は？
- Re: (スコア:0)
  
  by Anonymous Coward
  
  事実になってしまった時に謝罪するかどうか。
  # それは虚構
朝日新聞社メディアラボ (スコア:0)

by Anonymous Coward on 2020年11月21日 14時22分 (#3928492)

朝日新聞の一部門なのね。てっきりLinux MLD miniの件 [srad.jp]で
話題となったメディアラボと朝日新聞の合弁会社かと思った。
捏造と言えば (スコア:0)

by Anonymous Coward on 2020年11月21日 20時13分 (#3928662)

産経新聞の内閣支持率捏造を14回もやっていたのは酷かったな
たまたま内部告発があったから捏造の事実が発覚したから、告発者には感謝
- Re: (スコア:0)
  
  by Anonymous Coward
  
  はいはい、ここでも「どっちもどっち」を書かないとノルマが達成できないんですね
こんな記事が生成された (スコア:0)

by Anonymous Coward on 2020年11月23日 17時48分 (#3929288)

オナラコ(10月2日-)は、日本の俳優、歌手。愛称は「ヒデキ」。
幼少時代より
～～～
2018年、NHK総合(2nd)ドラマ『美少女戦士セーラームーン』に、ヒデキ役で出演。
～～～
宮城県出身。身長163cm。

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

朝日新聞社メディアラボ、機械学習モデルが自動生成したフィクション記事を公開 34

朝日新聞社メディアラボ、機械学習モデルが自動生成したフィクション記事を公開 More ログイン

イマイチ (スコア:0)

機械学習モデルが自動生成したフィクション記事 (スコア:0)

Re:機械学習モデルが自動生成したフィクション記事 (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

てっきり (スコア:0)

Re:てっきり (スコア:1)

記事というより... (スコア:0)

Re: (スコア:0)

なかなか良い (スコア:0)

虚構新聞にはまだ遠い (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

ところで (スコア:0, すばらしい洞察)

Re: (スコア:0)

Re: (スコア:0, 参考になる)

Re: (スコア:0)

海外のことわざを再構成した「[穴埋め式]世界ことわざ辞典」というものも存在している模様 (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

え、みせちゃっていいの？ (スコア:0)

Re: (スコア:0)

新聞社が実際には在りもしないニュース記事書いて、一体どうするのかな？ (スコア:0)

Re: (スコア:0)

朝日新聞社メディアラボ (スコア:0)

捏造と言えば (スコア:0)

Re: (スコア:0)

こんな記事が生成された (スコア:0)

スラド