アカウント名:
パスワード:
でも存在しない単語の検索結果はどこから生まれたの?なぜそれが人為的に作られた Google のそれと一致するの?
#お前が無くした約100本のボールペンのうち、上司の机から出てきた(お前の主張では盗まれた)のはたった7~9本。#わずか1割にも満たない結果を持ってこの主張をするのは(略
「Googleの検索結果画面から結果を直接的に複製した」なら問題だけど、「(偶然Google経由で、偶然Google経由でしか辿り着けない)とあるページを閲覧し、そのURLがBingツールバーの機能としてユーザの同意を得てMSに送信され、それを後からBingのロボットがクロールし、その中に含まれていた妙な単語をBingが新規語として認識し、Bing側でも検索結果に含まれるようになった」なら、何の問題もない。
Googleが表示していた検索結果のうちわずかしかBing側に含まれてないというのが事実なら、裏で起きていたことが前者じゃなく後者であったということを示唆するように、自分には思える。
ドメインすら違うURLを「Google経由で検索して辿り着いたから」というだけの理由でBingがクロール遠慮する必要はないでしょ?Googleの検索結果に表示されるページは全部Googleのものだと言いたいなら、とんだジャイアニズムだ。
たぶんそれでしょうな。検索して移動したっていう情報のみがシグナルとして残れば、それが出てくるってのはありがち。 # Amazonの「コレを買った人はコレも買っています」もレアな組み合わせにお目にかかったりする。ACアダプタとオムツとか:-P # クリックの流れ(検索して移動→クリックして移動→クリックして移動→クリックして移動……)をclickstreamと呼ぶのはありそう。
で、たぶんそこまではGoogleもMicrosoftも争ってないと思う。問題は、その「検索単語と、その先のリンク」の流れがアリなのかどうかって所だと思う。これってたぶんGoogle狙い撃ちって言うよりは、AmazonとかeBayとかも検索単語とそのクリック先をペアで拾ったりしてそう。それは良いのか?ってところ。(Googleは駄目だって言ってて、MSはシグナルの一つって言ってる)検索単語とその結果のクリック先を覚えるのは、アリかナシかって話であって、シグナルの1つで割合が少ないから良いって話でもなさそーな。 # 間違った単語での「もしかして...では?」と上位の結果が同じになるって事は、シグナルの重み付けも結構高そう
使える情報をうまく使っているのか、他サービスの検索単語とその結果を掠め盗ってるのか……例えばオレオレ検索エンジンが、自分の仲間内でしか公開してない「slashdotのユーザ名を入れるとリアル勤務先サイトが出る」検索エンジンだったとして、仲間内で何度も使ってるうちに、いつの間にかBing検索でも同じ結果がでるようになったら、コピーされた!と思うんじゃないかな。 # 検索エンジンのキモは検索単語と検索結果順位だと思うので。 # 微妙なラインだけど、検索単語とそのクリック先ペアは、明らかに検索結果になるって判ってるんだからやっちゃ駄目な気はするなあ
「検索単語と、その先のリンク」の流れがアリなのかどうかって所だと思う。
「検索単語」じゃなくて、「リンク元のページ (検索結果を表示するページ) に含まれていた単語」ね。 # もちろん普通の検索エンジンでは「リンク元のページ (検索結果を表示するページ)」には「検索単語」が含まれている。
AmazonとかeBayとかも検索単語とそのクリック先をペアで拾ったりしてそう。 それは良いのか?ってところ。(Googleは駄目だって言ってて、MSはシグナルの一つって言ってる)
# 「検索単語」は「リンク元のページ (検索結果を表示するページ)に含まれていた単語」と読
お前いい加減臭いよ。ACで発言しづらくなるから止めてくんない?「検索単語」も「リンク元のページ (検索結果を表示するページ) に含まれていた単語」も妄想でしかないだろ。断言してる分お前のがタチ悪いよ。巣に帰れ。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
皆さんもソースを読むときに、行と行の間を読むような気持ちで見てほしい -- あるハッカー
割合が低いのでは (スコア:0)
わずか1割にも満たない結果を持ってこの主張をするのはちょっと苦しいのでは。
Re: (スコア:0)
でも存在しない単語の検索結果はどこから生まれたの?
なぜそれが人為的に作られた Google のそれと一致するの?
#お前が無くした約100本のボールペンのうち、上司の机から出てきた(お前の主張では盗まれた)のはたった7~9本。
#わずか1割にも満たない結果を持ってこの主張をするのは(略
Re: (スコア:0)
「Googleの検索結果画面から結果を直接的に複製した」なら問題だけど、
「(偶然Google経由で、偶然Google経由でしか辿り着けない)とあるページを閲覧し、
そのURLがBingツールバーの機能としてユーザの同意を得てMSに送信され、
それを後からBingのロボットがクロールし、その中に含まれていた妙な単語をBingが新規語として認識し、
Bing側でも検索結果に含まれるようになった」なら、何の問題もない。
Googleが表示していた検索結果のうちわずかしかBing側に含まれてないというのが事実なら、
裏で起きていたことが前者じゃなく後者であったということを示唆するように、自分には思える。
ドメインすら違うURLを「Google経由で検索して辿り着いたから」というだけの理由で
Bingがクロール遠慮する必要はないでしょ?
Googleの検索結果に表示されるページは全部Googleのものだと言いたいなら、とんだジャイアニズムだ。
Re:割合が低いのでは (スコア:2, 興味深い)
IEツールバーで検索語を入力して表示したページ(普通は何らかの検索エンジンの検索結果)でどこをクリックしたか?という情報だと思われます。すなわち、
「<検索語> <クリックされたURI> <カウント(頻度)> 」と言うペアからなるデータが保存されている訳です。
(これらの情報はIE8(9)のインストール時あるいは初回起動時あるいはツールバーの初回起動時に、送信許可を求めるダイアログが出るんだったと思います)
今回のグーグルの「実験」は「<特定の検索語(滅茶苦茶な綴り)> <グーグルの用意した検索結果>」というペアをIEツールバー(またはそのエミュレータ)を用いて
マイクロソフトに大量に送り付けたものと考えられます。
公式見解
http://www.bing.com/community/site_blogs/b/search/archive/2011/02/01/thoughts-on-search-quality.aspx
によると、1000以上のシグナルを用いて表示されるページの順位を決めているとありますが、おそらく滅茶苦茶な綴りの文字列を検索語とした場合、
通常考えられるシグナルは全く反応しないことが想像されます。とすると、グーグルの「実験」によって送られた偽のclickstreamのみのシグナルが
残り、グーグルが用意した検索結果が検索される、ということです。
従って、(clickstream以外のシグナルが殺されるような検索語の場合)例えばグーグルの結果で3番目に表示されたものが最もクリックの頻度が高ければ、
bingで一位になるのはグーグルでは3番目の結果であると想像されます。すなわちグーグルの結果とは表示順位が異なる可能性もあり、グーグルの結果
のコピーとは異なります。
これは、滅茶苦茶な綴りであれば簡単にSEOできてしまう脆弱性と考えられますから、「clickstream以外のシグナルが殺された場合は反応しない」
と言った対策が取られると想像されるのでもう検証はできないと思いますが、もしMSがこの脆弱性を放置するなら、以下の方法で私の妄想は確認できます。
1. 適当にbingにindexされているURIを選択する。適当な単語でbingで検索した結果の(例えば1位の)URIを記録すれば良い。
2. 滅茶苦茶な綴りの単語を用意する(アルファベットが望ましい。日本語だと形態素解析のために複数の単語と認識される可能性が高いため)
3. 俺俺検索エンジンを作る。仕様は2.の検索語を入力すれば1.のURIが検索結果として表示されるものであれば良い。簡単なCGIでOK
4. 3をIEのツールバーに登録し、2.の検索語で検索し、出てきた検索結果をクリックして1.のURIに飛ぶ
(4.については沢山のコンピュータで沢山やる必要があるかもです)
これで、しばらくすると<2の検索語>で<1のURI>がbingの検索結果に現われるのであれば、「bingは俺俺検索エンジンのコピーだ」と主張できます。
本当かな?
Best regards, でぃーすけ
Re:割合が低いのでは (スコア:2)
たぶんそれでしょうな。
検索して移動したっていう情報のみがシグナルとして残れば、それが出てくるってのはありがち。
# Amazonの「コレを買った人はコレも買っています」もレアな組み合わせにお目にかかったりする。ACアダプタとオムツとか:-P
# クリックの流れ(検索して移動→クリックして移動→クリックして移動→クリックして移動……)をclickstreamと呼ぶのはありそう。
で、たぶんそこまではGoogleもMicrosoftも争ってないと思う。
問題は、その「検索単語と、その先のリンク」の流れがアリなのかどうかって所だと思う。
これってたぶんGoogle狙い撃ちって言うよりは、AmazonとかeBayとかも検索単語とそのクリック先をペアで拾ったりしてそう。
それは良いのか?ってところ。(Googleは駄目だって言ってて、MSはシグナルの一つって言ってる)
検索単語とその結果のクリック先を覚えるのは、アリかナシかって話であって、シグナルの1つで割合が少ないから良いって話でもなさそーな。
# 間違った単語での「もしかして...では?」と上位の結果が同じになるって事は、シグナルの重み付けも結構高そう
使える情報をうまく使っているのか、他サービスの検索単語とその結果を掠め盗ってるのか……
例えばオレオレ検索エンジンが、自分の仲間内でしか公開してない「slashdotのユーザ名を入れるとリアル勤務先サイトが出る」検索エンジンだったとして、
仲間内で何度も使ってるうちに、いつの間にかBing検索でも同じ結果がでるようになったら、コピーされた!と思うんじゃないかな。
# 検索エンジンのキモは検索単語と検索結果順位だと思うので。
# 微妙なラインだけど、検索単語とそのクリック先ペアは、明らかに検索結果になるって判ってるんだからやっちゃ駄目な気はするなあ
Re: (スコア:0)
「検索単語」じゃなくて、「リンク元のページ (検索結果を表示するページ) に含まれていた単語」ね。
# もちろん普通の検索エンジンでは「リンク元のページ (検索結果を表示するページ)」には「検索単語」が含まれている。
# 「検索単語」は「リンク元のページ (検索結果を表示するページ)に含まれていた単語」と読
Re: (スコア:0)
お前いい加減臭いよ。ACで発言しづらくなるから止めてくんない?
「検索単語」も「リンク元のページ (検索結果を表示するページ) に含まれていた単語」も妄想でしかないだろ。
断言してる分お前のがタチ悪いよ。巣に帰れ。
Re: (スコア:0)
元コメントのどこがどう何を断言してるのかわかりませんが?
妄想してるのはどっち?