
minetの日記: 特定文字種の2文字組でフィルタリングすることの落とし穴 8
日記 by
minet
このストーリーを読んで、オフトピな昔話を思い出したので日記に。
もう10年ほどは前だろうか。
かつてNortonのインターネットセキュリティ(という名前では当時なかったかもしれない)では、Webコンテンツフィルタリングの実装が
「URL中にアルファベット2文字組独立で ad とあるものは、アダルトコンテンツとみなす」「そのようなアドレスへのリンクは、不適切とみなす」
のような素朴なものだった時代があった。
これが日本語をUTF-8でパーセントエンコードすると %AD が頻発してしまい(カタカナの「キ」とか)、まるでダメ文字的な存在になってしまっていた。
そしてこれは、当時先駆的にUTF-8による日本語URLを全面的に導入していた大規模サイトであるWikipedia日本語版にて盛大に衝突し、「一部ページがなぜか表示できない」バグ報告として発覚することとなった。
ほどなく現象がNorton使用者の一部に限られ、対象ページはURLに %AD を含むことが判明し、Nortonのフィルタリングのバグと決着した。
Win/Macとも2001年から (ja.wikipedia.org情報に拠る) (スコア:1)
当時もNorton Internet Security というプロダクト名称であった証拠は追いかけることが可能。この情報に基づいた [wikipedia.org]。
そこに情報がなかったとしても個人的に当時は1プロダクト1PCのライセンスで購入していたはずだし、10年前だったら奮発して購入した覚えもある。探せば腐海の底からパッケージの外箱も出で来ると思う。あまり気が進まないが。
そのほか、今から20年くらい前のNortonあーたらは$WINDIRのさらに深いところにあるetc\hostsファイルを勝手に書き換えるタイプだったことも懐かしい話だ。
ひょっとして (スコア:0)
ad.jpが全滅だったりしたんでしょうか……
Re:ひょっとして (スコア:1)
nic.ad.jpも見れないのかよ! と、当時笑いものにしてた記憶があるので、
たぶん全滅だったと思われ。
氏ね (スコア:0)
「巨乳」「死ね」が禁止ワードになってる某ブログ。
「巨乳」はまだしも「死ね」はないよなあ。
http://srad.jp/comments.pl?sid=613611&cid=2474739 [srad.jp]
#ちなみに「貧乳」はOKらしい。なんという胸囲の格差社会。
Re:氏ね (スコア:1)
そういやウルトラマン○スモスとか
Re: (スコア:0)
広告とか荒らしの常用ワードが入ったって事かもしれん
# ひんぬー好きは紳士ということか(違う)
Re: (スコア:0)
禁止ワードの選定は「広告とか荒しの常用ワード」であるだけでなく、
且つ「それ以外では使用されないワード」にすべきなんですよね、
「死ね」とか"http://"なんて誤認識しまくりじゃん。
「巨乳」とか「パンチラ」とかでも、ネタによっては頻出単語だし。
#自転車乗りでイヤフォンっぽいものを全部指導してたら、補聴器まで指導してしまった的な。
#まあこれはもっと補聴器と分かるデザインにしろという気はする。盲導犬なんかと同じ。
Re: (スコア:0)
特に禁止ワードでもなかった2chで%subject%の隠語が流行ったのは皮肉かなんかだったんですかね。
で、今やその2chが禁止ワードの嵐という皮肉。