パスワードを忘れた? アカウント作成
173802 journal

taggaの日記: RSSがこけるのはしようがないのか 5

日記 by tagga

実験のため数度書き直しています。また、RSSリーダーで問題が起こる可能性があります。

yasuoka先生の日記をRSS のバリデータにかけた結果:

拡張領域の実験[2009-12-12 08h30]

CJK統合拡張B (例: U+20B9F) [文字参照](&を変換)

  • 16進 [𠮟](𠮟)
  • 10進 [𠮟](𠮟)
  • サロゲートペア [問題箇所コメントアウト](��)

スラドでは問題の文字をUTF8でそのまま入れると、その文字以下が削除される模様。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by hylom (27448) on 2009年12月11日 16時26分 (#1687391) ホームページ 日記

    とりあえず問題は把握しましたが、どうしよう……という感じです。ささっと直せそうな感じではなさそうな。

    • スラドの問題ではなく RSS リーダの側の問題ですね。 アドホックな修正をすると Google リーダのように 読めているものに影響してしまいそうですし。

      表の記事のもののように日記の RSS も <description><![CDATA[...]]></description> のようにするのは、うまくいかないんでしょうか。

      親コメント
      • いえ、不正なXMLを吐いてるスラドの問題です。これを「RSSリーダの問題」と言うのは、絵文字が読めないことや連続ドットを含んだメールアドレスを受け付けないことを、Windows Liveメールの問題だと言うようなものです。XMLの仕様はエラー処理も規定しているので、これは読めるほうがバグです。
        前から安岡先生の日記が文字化けしているのは何かと思っていたのですが、不正な文字参照の並びがIEやChromeやOperaではあたかもサロゲートペアのように扱われることを悪用して「口へんに七」を書いていたのですね。

        親コメント
typodupeerror

日々是ハック也 -- あるハードコアバイナリアン

読み込み中...