アカウント名:
パスワード:
PageRankを見るためだけにWeb閲覧履歴を差し出しでいた人がどれくらいいるのかは存じ上げませんが、それと何が違うのでしょうか。平文かそうでないかの違いかな?あと、各社のブラウザに搭載されているフィッシング対策機能も閲覧履歴を送信しています。
>各社のブラウザに搭載されているフィッシング対策機能も閲覧履歴を送信しています。
送信してないよ。
なかにはしてる特殊なやつもあるかもしれんがね。
じゃあ閲覧履歴を渡さずにどうやってフィッシング対策機能を実現しているのか説明してください。フィッシング対策機能って要するに「今から見ようとしてるこのURLは安全ですか?」と毎回問い合わせてる機能ですよ。
> アクセスするURLをハッシュ化し、リスト中の上位8桁とマッチすればGoogleのAPIに問い合わせる。
ハッシュ値が8桁となるようなハッシュ関数使ってる、ってことですよね、これ
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
海軍に入るくらいなら海賊になった方がいい -- Steven Paul Jobs
Googleと何が違うのか (スコア:0)
PageRankを見るためだけにWeb閲覧履歴を差し出しでいた人がどれくらいいるのかは存じ上げませんが、それと何が違うのでしょうか。
平文かそうでないかの違いかな?
あと、各社のブラウザに搭載されているフィッシング対策機能も閲覧履歴を送信しています。
Re: (スコア:0)
>各社のブラウザに搭載されているフィッシング対策機能も閲覧履歴を送信しています。
送信してないよ。
なかにはしてる特殊なやつもあるかもしれんがね。
Re: (スコア:1)
じゃあ閲覧履歴を渡さずにどうやってフィッシング対策機能を実現しているのか説明してください。
フィッシング対策機能って要するに
「今から見ようとしてるこのURLは安全ですか?」
と毎回問い合わせてる機能ですよ。
Re: (スコア:5, 参考になる)
Google Safe Browsing APIを使っている場合(Firefox、Safari、Chrome)は
あらかじめフィッシングサイトの情報をダウンロードして、それと照合している。
ただ、すべてのフィッシングサイトのURLを事前に保持しておくのは効率が悪いので
URLをハッシュ化し、そのうちの上位8桁(だったと記憶してる)だけのリストを保持している。
そしてアクセスするURLをハッシュ化し、リスト中の上位8桁とマッチすればGoogleのAPIに問い合わせる。
そして全桁がマッチするようであれば、そのサイトをフィッシングサイトとしてブロックする。
上位8桁がマッチした場合でも、送られるのは生のURLではなくてハッシュ化されたURLなので
Googleは閲覧履歴を手に入れているわけではない。
(ハッシュ化された情報を元に戻すことは事実上できない)
Re: (スコア:2)
> アクセスするURLをハッシュ化し、リスト中の上位8桁とマッチすればGoogleのAPIに問い合わせる。
ハッシュ値が8桁となるようなハッシュ関数使ってる、ってことですよね、これ
みんつ
Re:Googleと何が違うのか (スコア:0)
ハッシュ関数にはAPI v2ではSHA 256を使っています。
しかし、何万、何十万とあるフィッシングサイト(とマルウェア配布サイト)のURLのハッシュ値を
256bit長ですべて取得、保持するのはネットワーク的にもディスク領域的にも無駄があります。
(しかも、この情報は刻々と更新されていて、時間が経てば価値のなくなる類のものです)
ですから、256bitのうち、先頭の32bit(16進数なら8桁)だけを切り出したリストを事前に取得することにしています。
こうすることで取得するデータは(ハッシュについては)1/8に抑えることができます。
もしも、ハッシュ先頭の32bitがマッチした場合は、Googleにその先頭の32bitだけを送ります。
(生のURLを送るわけでも、256bitすべてを送るわけでもありません)
そうすると、先頭の32bitが同じ256bitのハッシュがすべて送られてきます。
そして今度はその256bitのハッシュリストを比較して、すべてマッチするハッシュ値が存在すれば
そのサイトはフィッシングサイト or マルウェア配布サイトだ!ということが分かります。