taggaの日記: RSSがこけるのはしようがないのか 5
日記 by
tagga
実験のため数度書き直しています。また、RSSリーダーで問題が起こる可能性があります。
yasuoka先生の日記をRSS のバリデータにかけた結果:
- http://feedanalyzer.com/?url=http%3A%2F%2Fslashdot.jp%2F~yasuoka%2Fjournal%2Frss
- http://validator.w3.org/feed/check.cgi?url=http%3A%2F%2Fslashdot.jp%2F~yasuoka%2Fjournal%2Frss
拡張領域の実験[2009-12-12 08h30]
CJK統合拡張B (例: U+20B9F) [文字参照](&を変換)
- 16進 [𠮟](𠮟)
- 10進 [𠮟](𠮟)
- サロゲートペア [問題箇所コメントアウト](��)
スラドでは問題の文字をUTF8でそのまま入れると、その文字以下が削除される模様。
うーん (スコア:1)
とりあえず問題は把握しましたが、どうしよう……という感じです。ささっと直せそうな感じではなさそうな。
悪夢のサロゲートペア (スコア:1)
スラドの問題ではなく RSS リーダの側の問題ですね。 アドホックな修正をすると Google リーダのように 読めているものに影響してしまいそうですし。
表の記事のもののように日記の RSS も <description><![CDATA[...]]></description> のようにするのは、うまくいかないんでしょうか。
Re:悪夢のサロゲートペア (スコア:2)
いえ、不正なXMLを吐いてるスラドの問題です。これを「RSSリーダの問題」と言うのは、絵文字が読めないことや連続ドットを含んだメールアドレスを受け付けないことを、Windows Liveメールの問題だと言うようなものです。XMLの仕様はエラー処理も規定しているので、これは読めるほうがバグです。
前から安岡先生の日記が文字化けしているのは何かと思っていたのですが、不正な文字参照の並びがIEやChromeやOperaではあたかもサロゲートペアのように扱われることを悪用して「口へんに七」を書いていたのですね。
Re:悪夢のサロゲートペア (スコア:1)
ご指摘ありがとうございます。
サロゲートペアによる表示が今のところ一番、表示されやすいという現状は困りものですね。
Re:悪夢のサロゲートペア (スコア:1)