朝日新聞社メディアラボ、機械学習モデルが自動生成したフィクション記事を公開 34
ストーリー by nagazou
まれに本物な記事が出たりしそう 部門より
まれに本物な記事が出たりしそう 部門より
11月18日に、朝日新聞の一部門で新規ビジネスの開発などを行っている朝日新聞社メディアラボは「♯この記事は実在しません」という技術デモを発表した。この技術デモは、機械学習を利用して自動的に記事を生成する試みで、ページをリロードするごとに自然な、しかし実際には存在していない記事を自動的に生成することができる。
この記事は実在しませんでは、人間の話す文章の構造などを定式化する言語モデルを用いて作成された。朝日新聞には過去30年にわたって蓄積してきた記事データがあることから、これを元にして言語モデルを生成したという。文章生成にはOpenAIが開発したキスト生成モデル「GPT-2」が使用されているとのこと。
この記事は実在しません以外にも、日本語データのみから作られた言語モデルを使用して海外のことわざを再構成した「[穴埋め式]世界ことわざ辞典」というものも存在している模様([穴埋め式]世界ことわざ辞典[PDF])。
この記事は実在しませんでは、人間の話す文章の構造などを定式化する言語モデルを用いて作成された。朝日新聞には過去30年にわたって蓄積してきた記事データがあることから、これを元にして言語モデルを生成したという。文章生成にはOpenAIが開発したキスト生成モデル「GPT-2」が使用されているとのこと。
この記事は実在しません以外にも、日本語データのみから作られた言語モデルを使用して海外のことわざを再構成した「[穴埋め式]世界ことわざ辞典」というものも存在している模様([穴埋め式]世界ことわざ辞典[PDF])。
イマイチ (スコア:0)
GPT-2は前評判はよかったけど、チューニングがいまいちなのか日本語に適していないのか、まだまだ不自然ですね。
機械学習モデルが自動生成したフィクション記事 (スコア:0)
つまりは、取材や自動収集した(朝日新聞社が事実と認める)情報から自動生成した、試記事としてすら公表できる水準にないって事。
朝日新聞では、通信社や記者(日本人とは限らない)とデスクの間の編集者が、自然な日本語記事に仕上げて来る位には優秀だから、その目には適わなかったのだろう。
Re:機械学習モデルが自動生成したフィクション記事 (スコア:1)
(朝日新聞にとって)「政治的に正しくない」記事が生成されてしまう問題が解決できなかったとか
Re: (スコア:0)
Microsoft「うっ頭が」
Re: (スコア:0)
> (朝日新聞社が事実と認める)情報
だからフィクション記事なんですね。
Re: (スコア:0)
チューニングにウィキペディア日本語版を使っている時点でお察し。
Re: (スコア:0)
無料デモなんだから、この程度にしとかないとな。
てっきり (スコア:0)
取材メモ的な情報を与えたら記事にまとめてくれる奴かと思ったら違った。作る文章が「記事」である必要があるのだろうか。
記事文の裏付けチェックとかコンプラチェックとかしてくれるAIの方がずっと必要とされているんじゃなかろうか。
Re:てっきり (スコア:1)
GPTシリーズは1からN番目までの単語を見て、N+1番目の単語を勘で推測するシステム
ネットの書き込みとかで勘を鍛えると意外と簡単な受け答えが書けたりする
でも「この後に続く文はズバリ何だと思う?」という質問にしか答えてくれないので
自然で滑らかな文章を無限に生成することはできても正確な情報は扱えないんだよね
確かに「検索エンジンとして応用できるのでは?」という提案は見かけたかな
記事というより... (スコア:0)
何度か試してみたけどWikipediaの概要風な文章が出力されたんだけど。
これ記事じゃなくない?
Re: (スコア:0)
記事というよりは、記事の最後についている人物プロフィールとか用語についての解説だね。
事件記事についても出力できるようにもできるのかもしれないが、
内容によって架空でも人権侵害になったり、凄惨な内容の記事が出力されかねないから抑制しているのかも。
なかなか良い (スコア:0)
これまでも日本語文章を自動生成させようとする試みはあったけど、ヒジョーにイマイチな結果に止まっていた。それらと比較すると、これは大きな進歩を感じる。
虚構新聞にはまだ遠い (スコア:0)
まだ短信レベルだからなあ。それでも取りあえず読める、みたいなものが出てくるのはなかなか。
Re: (スコア:0)
天声人語ぐらいなら出てくるんじゃね。
人間(朝日新聞の論説委員)が書いても要約しづらいから自動生成でも変わらん。
Re: (スコア:0)
AIの書いた記事から「筆者の心情を述べよ」という入試問題ができる時代が来るのか
Re: (スコア:0)
> それらと比較すると、これは大きな進歩を感じる。
いや、このシステムが進歩したんじゃなくて、それを進歩かどうかを判断する人間が大きく劣化しただけだと思うよ。
「#この記事は実在しません 」を幾つか読んだけど、得体の知れない言葉使いや内容の論理破綻が目に付くものだった。機械が書いた文章かどうかは分からないが、少なくともマトモな教育を受けた人間が書いた文章ではない、というのは分かった。
まあ、「#この記事は実在しません 」レベルの文章を書く人間は少なくないのが実相だから、世の中の状態に合わせたシステムなのかな、とも思う。
ところで (スコア:0, すばらしい洞察)
性奴隷慰安婦は実在しませんの反省記事を一生作成してろよ
Re: (スコア:0)
サンゴに刻みつけたるわ
Re: (スコア:0, 参考になる)
慰安婦報道が捏造であると言ってOKとの最高裁の判断が出ましたね。
https://www.asahi.com/articles/ASNCM6HHQNCMUTIL02Z.html [asahi.com]
Re: (スコア:0)
慰安婦に関する記事を捏造だと指摘したのは名誉毀損に当たるどうかを争った裁判だから、
問題となった記事は捏造と言っても名誉毀損には当たらないという相当の理由はあったんでしょう。
上村さんも桜井さんもジャーナリストだから問題の記事が事実かどうかについては争えたのかなぁと。
それを
> 慰安婦報道が捏造であると言ってOKとの最高裁の判断が出ましたね。
と、全ての報道について拡大解釈するのはどうなんでしょう。
他の慰安婦関連の記事を何の根拠もなく捏造だと言ったら名誉毀損が認められるかもしれないわけで。
海外のことわざを再構成した「[穴埋め式]世界ことわざ辞典」というものも存在している模様 (スコア:0)
当然「泣く子は餅を一つ多くもらえる」は入っているべき。
https://dic.nicovideo.jp/a/%E6%B3%A3%E3%81%8F%E5%AD%90%E3%81%AF%E3%82%... [nicovideo.jp]
Re: (スコア:0)
性奴隷慰安婦は実在しませんの反省記事を一生作成してろよ
①慰安婦は実在した→なので安倍首相が韓国と話を付けた
※安倍さん難しい問題の落としどころに頑張った
※ただその後の韓国側の諸々の言動は大変腹立たしい しかしそれが慰安婦の実在を否定する理由にはならない
②強制連行だったがどうかが論点になった→朝日新聞の報道の根拠に問題があり朝日は以前 謝罪訂正した
※なお今回の裁判はこれら事実関係が論点になったものではなく櫻井よしこ先生のお気持が論点で櫻井さんの勝ち
③朝日新聞が性奴隷と報道したことはあったっけ
ここらへんを整理しないといつまでもフェイクや粘着が沸いてきてうざいですねぇ(まぁ放置してもいいけど)
Re: (スコア:0)
> ここらへんを整理しないと
とぼけてないで、最高裁が認めた櫻井よしこ氏の記事読めばいいじゃん。
Re: (スコア:0)
> 最高裁が認めた櫻井よしこ氏の記事
正確には、櫻井よしこ氏が正しいと信じるのも妥当と考える根拠があったですね。
記事の内容が正しいと認定してるわけではない。
Re: (スコア:0)
くやしいのぅw
Re: (スコア:0)
原発誤報もなー
え、みせちゃっていいの? (スコア:0)
朝日の秘密を見せてよかったの?
Re: (スコア:0)
中に人が入っている方が秘密なんで
新聞社が実際には在りもしないニュース記事書いて、一体どうするのかな? (スコア:0)
Re: (スコア:0)
事実になってしまった時に謝罪するかどうか。
# それは虚構
朝日新聞社メディアラボ (スコア:0)
朝日新聞の一部門なのね。てっきりLinux MLD miniの件 [srad.jp]で
話題となったメディアラボと朝日新聞の合弁会社かと思った。
捏造と言えば (スコア:0)
産経新聞の内閣支持率捏造を14回もやっていたのは酷かったな
たまたま内部告発があったから捏造の事実が発覚したから、告発者には感謝
Re: (スコア:0)
はいはい、ここでも「どっちもどっち」を書かないとノルマが達成できないんですね
こんな記事が生成された (スコア:0)
オナラコ(10月2日-)は、日本の俳優、歌手。愛称は「ヒデキ」。
幼少時代より
~~~
2018年、NHK総合(2nd)ドラマ『美少女戦士セーラームーン』に、ヒデキ役で出演。
~~~
宮城県出身。身長163cm。