パスワードを忘れた? アカウント作成
12115254 journal
日記

minetの日記: 特定文字種の2文字組でフィルタリングすることの落とし穴 8

日記 by minet

このストーリーを読んで、オフトピな昔話を思い出したので日記に。

もう10年ほどは前だろうか。
かつてNortonのインターネットセキュリティ(という名前では当時なかったかもしれない)では、Webコンテンツフィルタリングの実装が
「URL中にアルファベット2文字組独立で ad とあるものは、アダルトコンテンツとみなす」「そのようなアドレスへのリンクは、不適切とみなす」
のような素朴なものだった時代があった。
これが日本語をUTF-8でパーセントエンコードすると %AD が頻発してしまい(カタカナの「キ」とか)、まるでダメ文字的な存在になってしまっていた。
そしてこれは、当時先駆的にUTF-8による日本語URLを全面的に導入していた大規模サイトであるWikipedia日本語版にて盛大に衝突し、「一部ページがなぜか表示できない」バグ報告として発覚することとなった。
ほどなく現象がNorton使用者の一部に限られ、対象ページはURLに %AD を含むことが判明し、Nortonのフィルタリングのバグと決着した。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 当時もNorton Internet Security というプロダクト名称であった証拠は追いかけることが可能。この情報に基づいた [wikipedia.org]。
    そこに情報がなかったとしても個人的に当時は1プロダクト1PCのライセンスで購入していたはずだし、10年前だったら奮発して購入した覚えもある。探せば腐海の底からパッケージの外箱も出で来ると思う。あまり気が進まないが。
    そのほか、今から20年くらい前のNortonあーたらは$WINDIRのさらに深いところにあるetc\hostsファイルを勝手に書き換えるタイプだったことも懐かしい話だ。

  • by Anonymous Coward on 2015年06月08日 17時49分 (#2827376)

    ad.jpが全滅だったりしたんでしょうか……

  • by Anonymous Coward on 2015年06月08日 19時14分 (#2827410)

    「巨乳」「死ね」が禁止ワードになってる某ブログ。
    「巨乳」はまだしも「死ね」はないよなあ。
    http://srad.jp/comments.pl?sid=613611&cid=2474739 [srad.jp]

    #ちなみに「貧乳」はOKらしい。なんという胸囲の格差社会。

    • by minet (45149) on 2015年06月08日 19時21分 (#2827415) 日記

      そういやウルトラマン○スモスとか

      親コメント
    • by Anonymous Coward

      広告とか荒らしの常用ワードが入ったって事かもしれん
      # ひんぬー好きは紳士ということか(違う)

      • by Anonymous Coward

        禁止ワードの選定は「広告とか荒しの常用ワード」であるだけでなく、
        且つ「それ以外では使用されないワード」にすべきなんですよね、

        「死ね」とか"http://"なんて誤認識しまくりじゃん。
        「巨乳」とか「パンチラ」とかでも、ネタによっては頻出単語だし。

        #自転車乗りでイヤフォンっぽいものを全部指導してたら、補聴器まで指導してしまった的な。
        #まあこれはもっと補聴器と分かるデザインにしろという気はする。盲導犬なんかと同じ。

    • by Anonymous Coward

      特に禁止ワードでもなかった2chで%subject%の隠語が流行ったのは皮肉かなんかだったんですかね。
      で、今やその2chが禁止ワードの嵐という皮肉。

typodupeerror

※ただしPHPを除く -- あるAdmin

読み込み中...