パスワードを忘れた? アカウント作成
5347574 story
ニュース

アルゴリズムによるニュースの自動生成、すでに米国では実用段階に 54

ストーリー by hylom
勝手にニュースを集めてタレこんでくれるアルゴリズムがほしい 部門より
あるAnonymous Coward 曰く、

米国の新聞やニュースサイトでは、「生データから自動的に人間が読めるニュース記事を作成する」ということがすでに行われているらしい。米国の新聞紙面やニュースウェブサイトで今、こうしたアルゴリズムが生み出す記事がじわじわと数を増しているという。

すでにAutomated InsightsやNarrative Science、Journaticといった、自動生成したニュースを販売する企業も登場しているという。これらの企業は自動生成されたニュースをそのまま提供している場合もあれば、人間が手を入れていることもあるという。

日本ではまだこのような話はあまり聞かないが、数年後には一般的になっているかもしれない。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by Anonymous Coward on 2012年07月18日 8時29分 (#2195161)
    >日本ではまだこのような話はあまり聞かないが

    人力で編集しているのに意味不明な文章の記事が氾濫しているのですから、読み手に耐性ができれば一気に普及するんじゃないでしょうか。
  • by Anonymous Coward on 2012年07月18日 8時30分 (#2195162)

    天声人語風メーカー 朝日新聞社説簡単生成!
    http://taisa.tm.land.to/tensei.html [tm.land.to]

    • by Anonymous Coward

      MADテープに入ってたMADニュースを思い出しました。
      聞いた当時は衝撃だったなあ。

  • by sindobook (35700) on 2012年07月18日 9時14分 (#2195173)
    通信社の記事を論評せず垂れ流しするだけなので新聞社は記事を作成する必要すら無い。
    何も無いところから記事を捏造するので製造効率が良い。
    報道しない自由を行使して生産量をコントロール。
    ロケット打ち上げの記事でも「リレーって何ですか?」って質問する素人記者に取材させるので人的リソースの活用も効率的。
    • 現実には、大手全国紙やキー局は主要な記者会見に記者を送り込めてるけど、地方紙、地方局には不可能だから、通信社頼りになるのは致し方ないかと。ローカルニュース重視なんだし。

      それと通信社の記事でも。若干の論評されているよ。地方のラジオ局だとそのまま読み上げているから。

      そもそも送り込んでる記者がダメダメだとか、記事を書いている段階で赤い思想に染められていくとか、そういう問題点は多々あるけど。

      親コメント
    • by Anonymous Coward on 2012年07月18日 9時49分 (#2195197)

      それって最近のスラ・・・・

      #ゴメンナサイゴメンナサイ

      親コメント
      • by Anonymous Coward on 2012年07月18日 10時56分 (#2195240)

        それって最近のスラ・・・・

        #ゴメンナサイゴメンナサイ

        いや、ここはそのまま転載すれば良い物ですら、余計な編集を加えて劣化させるところだと思う。
        むしろ、てにをはが変なんて言うのは自動化すればなくなるよね?

        親コメント
      • by Anonymous Coward

        taraiokっていう自動投稿アカウントもあるみたいですしね。

        • by Anonymous Coward

          おおよそ、日本在住とは思えない時間に投稿してるもんな。

    • by Anonymous Coward on 2012年07月18日 10時11分 (#2195213)
      頭悪そうなコメントだな。
      どっかで見聞きしたセリフを切り貼りしているだけだし。
      まるで自動生成された文章みたいだ。

      あぁ、皮肉ってるのか。
      親コメント
    • >何も無いところから記事を捏造するので製造効率が良い。

      無からではなく、記者様もしくはスポンサー様の脳内から発生した情報なのかもしれない。
      #某国だとそれが国家的お家芸

      親コメント
    • by Anonymous Coward

      >ロケット打ち上げの記事でも「リレーって何ですか?」って質問する素人記者に取材させるので人的リソースの活用も効率的。

      いいかげん賞味期限切れているような気がするのですが、新ネタはないのですか?

    • by Anonymous Coward

      かつて、大本営発表を配信する通信社として存在した同盟通信社が、終戦時にGHQによる解体から逃れるために解散の形を装って分社したのが共同通信と時事通信。
      大手マスゴミの政府関係の報道については、各省庁の記者クラブで捏skdlka配信されたものを流してる。

      ケーサツが容疑者を逮捕して、「違法とわかっていたがお金のためにやった。反省していると容疑を認めたとのことのです」というのを流すときに使われるのが警察に詰めてる記者たちだったりするね。
      ケーサツやケンサツのストーリーに沿った捏skjda捜査状況を流したりするのによく使われます。

      こんなのに自動生成ニュースなんか入れた日にゃ、記者クラブの人間は不要になって、プロパガンダやりたい放題ですな。

      • by Anonymous Coward

        あぁ、つまり朝日ね。

  • 日本でも実用されている (スコア:3, おもしろおかしい)

    by tacores (43628) on 2012年07月18日 9時51分 (#2195199)
    祝日に「株価ほとんど動かず」ってニュースが作られてました。
    http://d.hatena.ne.jp/nankin/touch/20081013
    • by Anonymous Coward

      「今日は交通死亡事故がありませんでした」
      「今日は鉄道での人身事故がありませんでした」
      とか。

      もし交通死亡事故がない日が本当にあったらニュースになってもいいと思う。
      鉄道での人身事故はどうなのかな。年間数百件だとのことだから、ない日もあっていいはず。

  • by ironical azure frog (33652) on 2012年07月18日 11時23分 (#2195251)
    自動生成なら著作権が発生しない気がするのだがどうだろう?

    (そういえばjpop歌詞ジェネレーターみたいなのあったけど、あれも気になるねぇ。)
  • by iwakuralain (33086) on 2012年07月18日 10時20分 (#2195221)

    機械生成した記事にはPhotoshopで修正したモデル写真の時のように

    この記事は自動生成です

    と表示が義務付けられる日がくるんでしょうかね

    • by simulacrum (41765) on 2012年07月18日 10時56分 (#2195239) 日記

      むしろ記事が問題にされたときの新たな言い訳とか。

      「当記事はアルゴリズムによって生成されています。これは当社の主義主張とは一切関係ありません。」とか。

      親コメント
      • Re:将来的には (スコア:2, おもしろおかしい)

        by Anonymous Coward on 2012年07月18日 11時53分 (#2195269)

        本文はイメージです

        親コメント
        • by Anonymous Coward

          検索避けで本文を画像化するというやつですね。

      • by Anonymous Coward

        そのアルゴリズムを解析することで、その通信社の主義主張の偏りが判明するからいいんじゃないんでしょうか。

        朝日新聞において、一部の在日外国人による犯罪は、通名による報道が行われている例なんてわかりやすいですよね?

        # 他社報道と突き合わせればわかっちゃうんですよね。
        # 報道機関が複数あることの意義はこういうところだと思うんですが……最近じゃ共同/時事の横並びだったり
        # 他社報道のコピペだったり…

      • by Anonymous Coward

        弊社ならびにスポンサー様との関連はございません。
        当記事の正確性については保証いたしません。
        当記事の情報のご利用は、全て自己責任において行なってください。
        記事中の商標および著作物について、権利保有者様の権利を侵害する意図はございません。
        無断転載を禁じます。

        • by Anonymous Coward

          本記事は記者個人の感想であり……

  • by Anonymous Coward on 2012年07月18日 8時02分 (#2195150)
    「1984」の世界でも,あることないことでニュースをでっちあげていたような気がする。

    アルゴリズムが確立してしまえば,テキトーなデータソースを与えることでニュースができ上がってしまうのか…。

    # どうせなら「クライアントを与えたらソースコードを出力する」ようなアルゴリズムを…

    • by T.Sawamoto (4142) on 2012年07月18日 11時32分 (#2195257)

      『一九八四年』のばやい、真理省の肝は過去の新聞記事の改竄・捏造なので、ちょっと状況が違うかもです。
      あらゆる過去の記録を書き換えてしまうため、真実は改竄した者にすら分からなくなってしまうという……。

      # ニュースの捏造も行ってましたけど、あれは大本営発表そのものですね(^^;)

      親コメント
  • by Anonymous Coward on 2012年07月18日 8時05分 (#2195152)

    え、最近のタレこみってとても人力で集めているような品質には思えなかったんだけどとっくに自動化されてたんじゃなかったの?
    採用のほうも。

    • by Anonymous Coward

      danceman
      eggy
      taraiok
      あたりはタレこみ自動化ソフトの名前だと思ってたよな。

      • by Anonymous Coward

        race conditionのバグが発生して(同じ文章をタレコんで)バレたんだっけ?

      • by Anonymous Coward

        それを言っちゃ、この宇宙そのものが全部シミュレーションなんだから。

  • by Anonymous Coward on 2012年07月18日 11時45分 (#2195265)

    記事中にそうわかるようにしておいて欲しいですね。
    ぢゃないと、虚構新聞と紙一重の可能性が・・・

  • by Anonymous Coward on 2012年07月18日 8時20分 (#2195159)

    圧縮新聞
    http://pha22.net/comp/ [pha22.net]

    • by Anonymous Coward

      それはすでに記事として書かれているものを要約しているだけ。
      全く違うものだ。

      • by Anonymous Coward
        要約ですらなく、ジョークアプリですよ。
        無関係な複数の記事をごちゃ混ぜにするんだから。
  • by Anonymous Coward on 2012年07月18日 9時41分 (#2195190)

    > 「生データから自動的に人間が読めるニュース記事を作成する」

    Wikipediaから自動的に人間が誤解するニュース記事を作成した

  • by Anonymous Coward on 2012年07月18日 10時06分 (#2195209)

    と、国会中継とか?(←嘘) :-)

  • by Anonymous Coward on 2012年07月18日 10時07分 (#2195211)

    もう25年ぐらい前でしたっけ?

  • by Anonymous Coward on 2012年07月18日 12時42分 (#2195299)

    本気で言ってます。

    煽り記事とか、主観的なまとめとか本当にいらないので。

    NHKならぬ、日本情報協会作って、国費で配信したらいいんじゃないだろうか?

    • 生データがどんな形式なのかは分からないけど、最低限5W1Hであれば個人的には賛成。
      編集が補足した記事が好きな人がいるのも分かるので、それは選択の自由ということで。

      生データがあると記者や編集が記事にしたときのバイアスも分かるし、いいんじゃない?

      親コメント
    • by Anonymous Coward on 2012年07月18日 17時10分 (#2195454)

      生データは恐らく、こんな感じ。

      えー、一方ですね、ことしの夏、夏のですね、首都圏の電力のですね、需給の見通しは、えー、猛暑が記録的な猛暑であってもですね、供給する電力の余力が、あー、比較的あるとされておりましてですね、昨年の夏よりも、あー、状況はかなり改善しているとされております。
      えー、しかし、この見通し、いや、需給見通しはですね、企業や個人の皆様のですね、自主的な節電の努力をなさることを前提と致しておりまして、火力発電所でですね、えー、そのー・・・トラブルがですね、発生する、そういった懸念がございますなど、不安要素も少なくございません。

      これを速記録にするとこんな風(実際に公開された速記録から引用)。

      一方、ことしの夏、首都圏における電力需給見通しは、記録的な猛暑であっても比較的供給余力があるとされておりまして、昨年の夏よりも状況は改善したとされております。
      しかし、この需給見通しは、企業や個人の自主的な節電努力を前提としていることや、火力発電所でトラブル発生の懸念があるなど、不安要素も少なくありません。

      # 発言者の方、ごめんなさい。

      実のところ、多くの委員会、公聴会では速記録を公開している(かなり後になる事も多いが)ので、それを見るとよいと思う。
      恐らく上記のような編集が行われた物ではあるけれど、最も生データに近い物ではあるから。

      親コメント
  • by Anonymous Coward on 2012年07月18日 17時02分 (#2195446)

    神林さんの「太陽の汗」で出てきたようなシステムが出来るかな?

  • by Anonymous Coward on 2012年07月18日 20時10分 (#2195530)

    ニュースジェネレータなんてありましたな。

    昔北朝鮮の平壌放送聞いた内容を、かつてBCLにハマってた知人に話したら、
    「15年前と言ってること変わんねぇw」と言っていたのを聞いて、もしかしてこれか? とも思ったものだった。

  • by Anonymous Coward on 2012年07月19日 2時48分 (#2195634)

    ブルームバーグが株価や指標を自動で記事にするのを1980年代に始めたときから記事の自動化は始まっていたそうです

typodupeerror

開いた括弧は必ず閉じる -- あるプログラマー

読み込み中...