アカウント名:
パスワード:
:visitedセレクタあたりを使って訪れているサイトを判定する。あとはそれを...どうやって取得するんだろうw
visited の時だけ参照するリソースを仕込む→ んでそのリソースのログを取る
と予想したらそのままでしたよ
PHPのプログラムまでは読みようがありませんが、http://www.making-the-web.com/misc/sites-you-visit/nojs/base.php [making-the-web.com]にアクセスすればほぼ仕組みはわかりますね。
ここのサイトへのリンクを貼り、それに個別のスタイルシートを適用して 、visited 時に特定のPHPに引数付きでアクセスするようにすることでPHP側で訪問済みサイトがわかるわけです。ただし欠点として、大量のリンクをブラウザ側で解析するので結構重いことがあげられそうです。
HTML形式の迷惑メールにCGIアクセスする画像を貼り付ける手法と手口は同じです。
これを防ぐには訪問済みサイトのスタイル変更を無効にするか、あるいはこまめにリセットするしかなさそうです。あるいはユーザースタイルシートなどを使い visited 時 のスタイルを強制的に固定するか。
ちなみにかなりの数のリストがありましたが海外サイトなのに楽天があったのがおかしい。
>ちなみにかなりの数のリストがありましたが海外サイトなのに楽天があったのがおかしい。
この人が、どんなサイトをチェック対象にする傾向があるのか、Javascriptを使ってた「前のデモ(My previous demo)」のvisitedチェックするサイト文字列の配列のページ [making-the-web.com]がそのままブラウザで読めるので、読みやすい。
多分Alexaの上位を単純にぶっこ抜いて生成してるんだと思うけど、はてなとかアメブロとか、がんばってんのな。
この方法って、直接「vistedなURLを取得できる」のではなく、「あるURLがvistedかどうか判定できる」ことを利用して虱潰しに検索してるわけですが、この方法だと、いかに大量の「判定用URLリスト」を持てるかどうかがキモだと思いますね。
判定用のページには大量(2000ぐらい?)のURLが埋め込まれてますが、さらにそのページをRefreshで随時更新していくことで、どんどん判定URLを送り込んでいるようです。20回リロードしてたので、約40000URLぐらいかな。ここ /.-J のストーリーもいくつかマッチしてました…
全ストーリーが入っているわけではなく、かなり歯抜けなのですが、Refererで集めたのか、それとも適当にクローリングしたんですかねぇ。
見て戻ってきたら遅かったorzみんな解析早すぎですよ
30分待ちなのでIDで
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
あと、僕は馬鹿なことをするのは嫌いですよ (わざとやるとき以外は)。-- Larry Wall
元記事を読まずに手口を予想 (スコア:0)
:visitedセレクタあたりを使って訪れているサイトを判定する。
あとはそれを...どうやって取得するんだろうw
Re:元記事を読まずに手口を予想 (スコア:3, 参考になる)
visited の時だけ参照するリソースを仕込む
→ んでそのリソースのログを取る
と予想したらそのままでしたよ
Re:元記事を読まずに手口を予想 (スコア:4, 参考になる)
PHPのプログラムまでは読みようがありませんが、
http://www.making-the-web.com/misc/sites-you-visit/nojs/base.php [making-the-web.com]
にアクセスすればほぼ仕組みはわかりますね。
ここのサイトへのリンクを貼り、それに個別のスタイルシートを適用して 、
visited 時に特定のPHPに引数付きでアクセスするようにすることでPHP側で訪問済みサイトがわかるわけです。
ただし欠点として、大量のリンクをブラウザ側で解析するので結構重いことがあげられそうです。
HTML形式の迷惑メールにCGIアクセスする画像を貼り付ける手法と手口は同じです。
これを防ぐには訪問済みサイトのスタイル変更を無効にするか、あるいはこまめにリセットするしかなさそうです。
あるいはユーザースタイルシートなどを使い visited 時 のスタイルを強制的に固定するか。
ちなみにかなりの数のリストがありましたが海外サイトなのに楽天があったのがおかしい。
Re: (スコア:0)
>ちなみにかなりの数のリストがありましたが海外サイトなのに楽天があったのがおかしい。
この人が、どんなサイトをチェック対象にする傾向があるのか、
Javascriptを使ってた「前のデモ(My previous demo)」のvisitedチェックするサイト文字列の配列のページ [making-the-web.com]
がそのままブラウザで読めるので、読みやすい。
多分Alexaの上位を単純にぶっこ抜いて生成してるんだと思うけど、
はてなとかアメブロとか、がんばってんのな。
Re:元記事を読まずに手口を予想 (スコア:2, 興味深い)
この方法って、直接「vistedなURLを取得できる」のではなく、
「あるURLがvistedかどうか判定できる」ことを利用して虱潰しに検索してるわけですが、
この方法だと、いかに大量の「判定用URLリスト」を持てるかどうかがキモだと思いますね。
判定用のページには大量(2000ぐらい?)のURLが埋め込まれてますが、さらにそのページをRefreshで随時更新していくことで、
どんどん判定URLを送り込んでいるようです。20回リロードしてたので、約40000URLぐらいかな。
ここ /.-J のストーリーもいくつかマッチしてました…
全ストーリーが入っているわけではなく、かなり歯抜けなのですが、
Refererで集めたのか、それとも適当にクローリングしたんですかねぇ。
Re:元記事を読まずに手口を予想 (スコア:1)
見て戻ってきたら遅かったorz
みんな解析早すぎですよ
30分待ちなのでIDで