mumumuの日記: RSSの制限? 2
日記 by
mumumu
一応RSSをパースしてテンプレートは作れるようにはなったのだが
http://slashdot.org/index.rssだと記事の本文はたった数フレーズ
しかとれない。。
なんとか全文を取りたいのだが、、HTMLを直接パースするしかない
かしらん。けどある意味そちらの方が楽かもしれない。
http://slashdot.org/index.pl?mode=&issue=20031204
てな感じで一日の記事が纏めてとれるしね。RSSのような種々の制
限もない。
http://slashdot.org/index.rssだと記事の本文はたった数フレーズ
しかとれない。。
なんとか全文を取りたいのだが、、HTMLを直接パースするしかない
かしらん。けどある意味そちらの方が楽かもしれない。
http://slashdot.org/index.pl?mode=&issue=20031204
てな感じで一日の記事が纏めてとれるしね。RSSのような種々の制
限もない。
記事の自動取得 (スコア:1)
ところで、既にRSSパーサーを持っておられるのでなければ、slashdot.xml [slashdot.org]を取得した方が楽かもしれません。古いパーサー用にはslashdot.rdf [slashdot.org]もあります。
HTMLで取得するのであれば、
http://slashdot.org/index.pl?light=1&issue=20031204
とすればライト・モードになるので、パーサーが組みやすいですよ。
Re:記事の自動取得 (スコア:1)
情報は非常に助かります。ありがとうございます。
HTTP::LiteとHTTP::Parserの組み合わせで今やっております。
# 無精、短気、傲慢、これ最強