Bingに「Googleの検索結果を盗んでいる」疑惑が浮上

Bingに「Googleの検索結果を盗んでいる」疑惑が浮上 127

ストーリー by hylom 2011年02月03日 18時00分
ハックかパクリか部門より

capra 曰く、

BingがGoogleの検索結果をコピーしているのではないかとの疑惑が持ち上がっている（engadget、Search Engine Land、本家/.）。
Googleがこの疑惑を持ち始めたのは、綴り間違いの単語で検索した場合の検索結果が同一になることが多かったからだそうだ。そこでGoogleのエンジニアは存在しない言葉と、その言葉をGoogleで検索した際に表示される「おとり」のページを用意。そしてBingツールバーがインストールされたIEを使い、Googleでこの言葉を検索した上で検索結果として表示されるおとりページをクリックしたところ、2週間後にはBingの検索結果にも同じページが表示されるようになったという。
この「おとり実験」の結果から、GoogleはBingがIEおよびBingツールバーを通じて検索結果をコピーしているとGoogleのエンジニアは主張しているとのこと。
なお、Microsoftはこの主張に対し「ページランキングの手法の詳細は明らかにできない」としながらも、「我々を含め全ての検索エンジンがサイトのランキングのために利用するインプットの一つとして、（Bingの）ツールバーはクリックストリームデータを提供している。Googleによるこの「実験」はこのようなインプットシグナルの利用を操作し混乱させるようなハックのように思える」と反論しているそうだ。

この議論は賞味期限が切れたので、アーカイブ化されています。新たにコメントを付けることはできません。

記事ページを表示すべてのコメント取得

検索127コメント Log In/Create an Account

問題あるの? (スコア:3, すばらしい洞察)

by mik_naruto (26947) on 2011年02月03日 18時40分 (#1897952)

＞Googleでこの言葉を検索した上で検索結果として表示されるおとりページをクリックしたところ
これ、おかしくない?
本当に検索結果を検索結果として盗んでいるなら、せめて「おとりページをクリックせず、Googleの検索結果画面を表示した」だけの状態で、おとりページがBingに捕捉される、くらいのことは言ってくれないと。
じゃなくて、Bingのツールバーを入れた状態で、おとりページを"実際に閲覧した"んであれば、その閲覧したページのことをBingが知ってたって、ひとまず問題ないのでは(ユーザの同意を得てるならプライバシー関連の問題はとりあえずおいとく)。
それともGoogleを経由して閲覧されたあらゆるページは除外されるべきだとでも? そんなことはむしろ不可能。
- どこがポイントなのか (スコア:3, 興味深い)
  
  by kousokubus (37099) on 2011年02月03日 22時32分 (#1898091)
  
  おかしくないよ。
  0. mbzrxpgjys でBing検索して match 0 なのを確認
  1. googleに mbzrxpgjys で検索すると RIM Company(www.rim.com) が出てくるようにhonypotセット
  2. Bing ツールバーのインストールされたIEで、 mbzrxpgjysをググる
  3. mbzrxpgjys の検索結果で出てくる www.rim.com をクリックする
  4. しばらく待つ
  5. Bingで mbzrxpgjys で検索すると www.rim.com が出てくる
  これは検索結果を盗んでると言えるんでないかな。
  閲覧したページのことをBingが知ってても問題ないかも知れない。
  だからRIM CompanyでBing検索して、www.rim.comが出てきても問題ない。
  でも、mbzrxpgjysでBing検索して出てくるなら「Googleを経由して閲覧されたページを覚えた」んではなくて「Googleでmbzrxpgjysで検索したという情報とヒモづけて、そのクリック先を覚えた」という事になる。
  このヒモ付けが問題。
  「むしろ不可能」じゃなくて「明確にやってないと可能にならない」事だよ。
  www.rim.comを覚えたんじゃなくて、何やったらwww.rim.comが出てくるかとヒモ付けて覚えるのは、検索結果のカンニングだcheatingだって言われてもしょうがないんじゃないかなあ。
  　# この手法だとGoogle検索＋人の判断が入るから、より効率よく検索結果を洗練できるね。
  　# まあ完コピじゃなくて1割以下っぽいし、こっそりテストしてたのがバレたってとこじゃないかな:-P
  
  シェア
  
  親コメント
  - - Re:どこがポイントなのか (スコア:2)
      
      by kousokubus (37099) on 2011年02月03日 23時27分 (#1898125)
      
      なんでならないの？
      この時点で検索結果の「ページ」に「mbzrxpgjys」という単語が含まれてしまっています。
      なら、mbzrxpgjysでBing検索したら、「Googleの検索結果のページ」が出てこないと駄目だろ。
      なぜそこを飛ばしていきなりwww.rim.comのサイトを表示するのか。
      www.rim.comには、bmzrxpgjysという単語は当然含まれてないよ。
      
      シェア
      
      親コメント
    - Re:どこがポイントなのか (スコア:1)
      
      by boxfox (22352) on 2011年02月04日 4時19分 (#1898241)
      
      この時点で検索結果の「ページ」に「mbzrxpgjys」という単語が含まれてしまっています。
      とあなたは仰いますが、検索結果のページには他にも無数の単語が含まれています。
      Bingはどのように「mbzrxpgjys」という単語を任意にピックアップし www.rim.com と関連付けているのでしょうか。
      
      シェア
      
      親コメント
      - Re:どこがポイントなのか (スコア:1)
        
        by boxfox (22352) on 2011年02月04日 13時24分 (#1898445)
        
        確かにそうですね、浅慮でした。
        個人的に気になるのは、では検索結果として表示されたWebサイト以外、例えばGoogleのプライバシーポリシーのページへ移動していたらどうなったのか、です。
        実験規模（20人、100語、2週間）から見て個人レベルでも追試ができそうな気がするので、誰か暇な人が試したりしないかしら。:x
        
        シェア
        
        親コメント
  - - Re:どこがポイントなのか (スコア:2)
      
      by kousokubus (37099) on 2011年02月03日 23時54分 (#1898138)
      
      このページ (キャプチャ画像) [searchengineland.com]を見ればわかるように、
      ページに mbzrxpgjys という単語が出てきてしまっています。
      つまり 3. の後 4. の手前段階で Bing は mbzrxpgjys と www.rim.com に関連があると判断できます
      (というか、判断させるように Google が cheat したといわれても仕方のないレベル)。
      「関連があると判断できます」って本気で言ってる？
      もしそうだとするならば、Bing検索はリンク前のページに含まれてる意味のない単語と、リンク先にはその単語が含まれていないにもかかわらず覚えるという凄いインデックス方式をとってることになるけれども。
      それがどんなURLであるとか、そのページが何かも一切解析せずに、単にページに含まれている単語とそのページでクリックされた所を一緒に覚えるわけかい？
      　# てことはだよ、Everythingって検索したり、Videosって検索したらwww.rim.comがでてきたりするのかい？
      ほんのすこしでもページの中身を解析すりゃ、RIM Companyのリンク周りにはRIM Companyって単語とかその関連情報が載ってるのは判るわけだし、それでもってヒモづけるなら判る。
      検索ボックス内の単語と、そのリンク先を一緒にして覚えました。でもGoogleだとは思ってません。
      ってのは、いくら何でも通らないのでは。というかソレこそがカンニングでは。
      
      シェア
      
      親コメント
- 偽Googleを用意すべきだったかもね (スコア:1)
  
  by greentea (17971) on 2011年02月04日 10時25分 (#1898326) 日記
  
  別ドメインにGoogleを用意して、そっちで同じことやって、
  偽Googleでの検索結果はBingに反映されなかったなら、怪しいかも。
  
  --
  1を聞いて0を知れ!
  
  シェア
  
  親コメント
Googleが懲りすぎたのが敗因ですね (スコア:2, すばらしい洞察)

by reininn (35924) on 2011年02月03日 18時45分 (#1897954)

もっとストレートに、存在しない嘘のページを Google の検索結果として出すようにして
しばらくして Bing が検索結果として出して来たら明らかだったんでしょうね。
- Re:Googleが懲りすぎたのが敗因ですね (スコア:2)
  
  by kousokubus (37099) on 2011年02月03日 22時41分 (#1898099)
  
  どうやってその存在しないウソのページをBingに拾わせるのさ？
  今回のは、Bingツールバーがユーザの行動を報告してる情報を元にインデックス作ってるって話だろうし。
  それに、いくらBingのエンジニアがうっかりしててもGoogleの検索結果に出てくるサイトが404だったり存在しないかどうか位は確認するだろ。
  　# まあ今回のだって検索文字列が覚えるページ内に存在してるかどうかをチェックするだけでバレなかった行動なので、確認しない可能性はあるけど:-P
  
  シェア
  
  親コメント
辞書の不正コピー対策 (スコア:2)

by chocopa (14067) on 2011年02月04日 8時34分 (#1898273)

IME2002で「ぎれ」を変換すると「ピカチュウ」になるのですが、
これも辞書の不正コピー対策と言われていますね。
Bingを叩いてる暇があったら (スコア:0)

by Anonymous Coward on 2011年02月03日 18時09分 (#1897929)

ゴミだらけの検索結果を何とかしろ。仮にBingがGoogleの検索結果をコピーしてるとしたら、Bingのほうがspam除去技術ではるかに上を行ってるってことじゃん。
公式サイトよりコピペspamアフィサイトのほうがGoogleにより多くの広告収入をもたらすからこれは意図した結果なんだっけ。競争相手がいればそこまで露骨にそんな悠長なことはしてられなかったはずだからやっぱり独占はろくな結果をもたらさないな。
- Re:Bingを叩いてる暇があったら (スコア:1, 参考になる)
  
  by Anonymous Coward on 2011年02月03日 18時38分 (#1897951)
  
  >ゴミだらけの検索結果を何とかしろ。
  もう始めてるよ
  http://googleblog.blogspot.com/2011/01/google-search-and-search-engine... [blogspot.com]
  http://internet.watch.impress.co.jp/docs/news/20110124_422448.html [impress.co.jp]
  
  シェア
  
  親コメント
なんとかツールバーってそういうもんだろw (スコア:0)

by Anonymous Coward on 2011年02月03日 18時14分 (#1897930)

Googleのツールバーだって何してるかわかんねーしw
０件だと… (スコア:0)

by Anonymous Coward on 2011年02月03日 18時17分 (#1897932)

誰かがそれを検索すると、Googleのページが出て来るのが正解なんじゃ？
オプトアウト (スコア:0)

by Anonymous Coward on 2011年02月03日 18時19分 (#1897935)

「見られて困るものはインターネットに公開するな」ってのが基本姿勢じゃなかった？
- Re:オプトアウト (スコア:1)
  
  by Kando (36875) <{kando} {at} {nerimadors.or.jp}> on 2011年02月03日 18時28分 (#1897940) ホームページ日記
  
  それに関しては、見るのはいいけど出典を明らかにすべきって話でないの？
  
  シェア
  
  親コメント
  - Re:オプトアウト (スコア:1)
    
    by cv (41694) on 2011年02月04日 1時08分 (#1898176)
    
    >見るのはいいけど出典を明らかにすべきって話でないの？
    検索された対象については、それは言えるだろうけど、どこで検索したかの表示義務は難しいのと違う？
    それを言ったら、ある本からの引用で、その本をどこで買ったか？見たか？の情報開示も義務付けされちゃうよね。
    何かしら「そういう情報があった」という情報については、著作権的にどうなんでしょうね？
    
    シェア
    
    親コメント
    - Re:オプトアウト (スコア:2, すばらしい洞察)
      
      by Kando (36875) <{kando} {at} {nerimadors.or.jp}> on 2011年02月04日 3時28分 (#1898226) ホームページ日記
      
      クローラー型の検索エンジンで検索結果のページがひっかかるってのは時々あって、そういう事例は別にいい。
      ＃検索結果は自動生成ページだろうからrobots.txtで避けておくのが基本だろうし。
      けど自社がクロールして検索した結果じゃなく、他社のクロール＆検索結果を、
      キーワードをスパイして自分の検索結果一覧に混ぜる（クロールはし直すにしても）のはちょっとなぁ。
      法的義務ではないとしてもあんまりフェアとはいえない気がするな。
      #法にしても著作権だけでなく不正競争防止とかの観点もあり得るし。
      それにBingツールバー使って入力してるのでない時に
      余所のページの入力フィールドを見ると言うのはプライバシー保護的にもグレーっぽい。
      ＃ツールバー使ってる時でも入力内容の利用がプライバシー・ポリシーに明示されてる範囲を超えると問題。
      最初から複数のエンジンを串刺すメタ検索か何かで、
      その検索対象にGoogleが入ってるとかならわかるが、
      それはそれで表明しておくのがフェアだと思うし、
      結果もどこ由来か表示するのは無理じゃないし、フェアでもある。
      ところで元の記事(#1897940)は(#1897935)という表明に対する一般的な話で、
      見るのも利用するのもかまわなくても引用・利用の仕方に問題があることはあろうって話。
      例えば秘密情報でなくても余所のコンテンツを自分の所のコンテンツの様な顔してframeに取り込むとかはフェアなやり口とは思えない。
      ＃frameの場合はtarget指定し忘れるという過失でそういう表示になることはあるが。
      
      シェア
      
      親コメント
おとりなんてめんどくさいことせんでも... (スコア:0)

by Anonymous Coward on 2011年02月03日 18時24分 (#1897938)

手元に鯖があるんだし、該当するセグメントのパケットをキャプるとかしたほうが良かったんちゃうんかしら
事実を解析せず実体験だけで「パクリだ！」って声高に言っても説得力ないお。残念ながらmsに言い分がある気が。
まぁ実際のところはパクってると思うケードーネー
割合が低いのでは (スコア:0)

by Anonymous Coward on 2011年02月03日 18時28分 (#1897941)

Googleが作った約100個の罠のうち、Bingに反映された(Googleの主張では盗まれた)のはたった7～9個。
わずか1割にも満たない結果を持ってこの主張をするのはちょっと苦しいのでは。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  でも存在しない単語の検索結果はどこから生まれたの？
  なぜそれが人為的に作られた Google のそれと一致するの？
  #お前が無くした約１００本のボールペンのうち、上司の机から出てきた(お前の主張では盗まれた)のはたった7～9本。
  #わずか1割にも満たない結果を持ってこの主張をするのは(略
  - - Re:割合が低いのでは (スコア:2, 興味深い)
      
      by Deasuke (34806) on 2011年02月03日 22時36分 (#1898094) 日記
      
      clickstreamという名前からの妄想ですが、
      IEツールバーで検索語を入力して表示したページ(普通は何らかの検索エンジンの検索結果)でどこをクリックしたか?という情報だと思われます。すなわち、
      「<検索語> <クリックされたURI> <カウント(頻度)> 」と言うペアからなるデータが保存されている訳です。
      (これらの情報はIE8(9)のインストール時あるいは初回起動時あるいはツールバーの初回起動時に、送信許可を求めるダイアログが出るんだったと思います)
      
      今回のグーグルの「実験」は「<特定の検索語(滅茶苦茶な綴り)> <グーグルの用意した検索結果>」というペアをIEツールバー(またはそのエミュレータ)を用いて
      マイクロソフトに大量に送り付けたものと考えられます。
      
      公式見解
      http://www.bing.com/community/site_blogs/b/search/archive/2011/02/01/thoughts-on-search-quality.aspx
      によると、1000以上のシグナルを用いて表示されるページの順位を決めているとありますが、おそらく滅茶苦茶な綴りの文字列を検索語とした場合、
      通常考えられるシグナルは全く反応しないことが想像されます。とすると、グーグルの「実験」によって送られた偽のclickstreamのみのシグナルが
      残り、グーグルが用意した検索結果が検索される、ということです。
      
      従って、(clickstream以外のシグナルが殺されるような検索語の場合)例えばグーグルの結果で3番目に表示されたものが最もクリックの頻度が高ければ、
      bingで一位になるのはグーグルでは3番目の結果であると想像されます。すなわちグーグルの結果とは表示順位が異なる可能性もあり、グーグルの結果
      のコピーとは異なります。
      
      これは、滅茶苦茶な綴りであれば簡単にSEOできてしまう脆弱性と考えられますから、「clickstream以外のシグナルが殺された場合は反応しない」
      と言った対策が取られると想像されるのでもう検証はできないと思いますが、もしMSがこの脆弱性を放置するなら、以下の方法で私の妄想は確認できます。
      
      1. 適当にbingにindexされているURIを選択する。適当な単語でbingで検索した結果の(例えば1位の)URIを記録すれば良い。
      2. 滅茶苦茶な綴りの単語を用意する(アルファベットが望ましい。日本語だと形態素解析のために複数の単語と認識される可能性が高いため)
      3. 俺俺検索エンジンを作る。仕様は2.の検索語を入力すれば1.のURIが検索結果として表示されるものであれば良い。簡単なCGIでOK
      4. 3をIEのツールバーに登録し、2.の検索語で検索し、出てきた検索結果をクリックして1.のURIに飛ぶ
      (4.については沢山のコンピュータで沢山やる必要があるかもです)
      
      これで、しばらくすると<2の検索語>で<1のURI>がbingの検索結果に現われるのであれば、「bingは俺俺検索エンジンのコピーだ」と主張できます。
      
      本当かな?
      
      --
      Best regards, でぃーすけ
      
      シェア
      
      親コメント
      - Re:割合が低いのでは (スコア:2)
        
        by kousokubus (37099) on 2011年02月04日 0時36分 (#1898163)
        
        たぶんそれでしょうな。
        検索して移動したっていう情報のみがシグナルとして残れば、それが出てくるってのはありがち。
        　# Amazonの「コレを買った人はコレも買っています」もレアな組み合わせにお目にかかったりする。ACアダプタとオムツとか:-P
        　# クリックの流れ（検索して移動→クリックして移動→クリックして移動→クリックして移動……）をclickstreamと呼ぶのはありそう。
        で、たぶんそこまではGoogleもMicrosoftも争ってないと思う。
        問題は、その「検索単語と、その先のリンク」の流れがアリなのかどうかって所だと思う。
        これってたぶんGoogle狙い撃ちって言うよりは、AmazonとかeBayとかも検索単語とそのクリック先をペアで拾ったりしてそう。
        それは良いのか？ってところ。（Googleは駄目だって言ってて、MSはシグナルの一つって言ってる）
        検索単語とその結果のクリック先を覚えるのは、アリかナシかって話であって、シグナルの１つで割合が少ないから良いって話でもなさそーな。
        　# 間違った単語での「もしかして...では？」と上位の結果が同じになるって事は、シグナルの重み付けも結構高そう
        使える情報をうまく使っているのか、他サービスの検索単語とその結果を掠め盗ってるのか……
        例えばオレオレ検索エンジンが、自分の仲間内でしか公開してない「slashdotのユーザ名を入れるとリアル勤務先サイトが出る」検索エンジンだったとして、
        仲間内で何度も使ってるうちに、いつの間にかBing検索でも同じ結果がでるようになったら、コピーされた！と思うんじゃないかな。
        　# 検索エンジンのキモは検索単語と検索結果順位だと思うので。
        　# 微妙なラインだけど、検索単語とそのクリック先ペアは、明らかに検索結果になるって判ってるんだからやっちゃ駄目な気はするなあ
        
        シェア
        
        親コメント
    - Re:割合が低いのでは (スコア:1)
      
      by vn (10720) on 2011年02月03日 19時27分 (#1897988) 日記
      
      それを後からBingのロボットがクロールし、その中に含まれていた妙な単語をBingが新規語として認識し、
      それは Google が実験したこととは異なる。
      Google で「妙な単語」を検索すると、ある URL が表示される。
      その URL は実在するウェブページを指しているが、その中をいくら調べても
      「妙な単語」はそこには存在していない。
      つまり、「妙な単語」と「URL」とを関連づける情報は Google Search の中にしかない。
      
      これでは、「Bing は Google Search の出力結果を参照して出力を改善している」と
      非難されても止むを得ない。
      
      シェア
      
      親コメント
      - Re:割合が低いのでは (スコア:1)
        
        by vn (10720) on 2011年02月03日 20時34分 (#1898028) 日記
        
        未知の単語についてすら、Bing は Google Search の出力結果を参照していると証明された。
        いわんや既知の単語においておや、参照していませんとシラを切るのは非常に難しい。
        
        というわけで "Bing - Powered by Google" の尊称を奉ろう。
        
        シェア
        
        親コメント
        
        Re:割合が低いのでは (スコア:1)
        
        by vn (10720) on 2011年02月04日 0時15分 (#1898152) 日記
        
        「参照はするけど、それは単なる普通のWebページの1つとしてGoogleの検索結果も取り扱った結果であり、Googleを狙って意図的に情報を抜くような実装は一切してない」ってこと。
        仮にこれが Microsoft の公式見解であるとしよう。
        零細な検索エンジン業者にとっては大変な朗報だ。なにしろ Microsoft が大枚はたいて作った
        Bing の検索結果が、「普通のWebページの1つ」として参照できる。ほとんど盗み放題だ。
        (数百万人のクリックストリームを取得することは、競争力のある検索エンジンの開発コストに
        比べれば無視できる程度のものだ。)
        ただし Microsoft には文句を言う権利がないとしても、もともと盗まれている Google から
        非難されることは覚悟せねばなるまい。
        
        シェア
        
        親コメント
        
        Re:割合が低いのでは (スコア:1)
        
        by cv (41694) on 2011年02月04日 0時54分 (#1898170)
        
        >いや「参照してません」なんて言ってないし、しらを切る必要なんてどこにもないでしょ。
        そう思う。
        検索エンジンが検索の対象になってもおかしくはないと思うんだけどね。
        検索エンジンって、そもそもそこらじゅうにあるモノを検索して集めるわけで、何も、他の公開されている検索エンジンを対象外にするルールがあるわけでもないと思うね。
        カンニングとか言っていても、探し得る情報を収集するといことで、まっとうな事だと思うけどね。
        検索エンジンって、集めた情報の量だけではなくて、料理の仕方(並べ方取捨選択)が結構重要で、その後者について追いつかれそうなGoogleの焦りみたいなものを感じます。
        
        シェア
        
        親コメント
      - Re:割合が低いのでは (スコア:1)
        
        by vn (10720) on 2011年02月03日 23時55分 (#1898139) 日記
        
        「Googleの検索結果のページ (つまり「妙な単語」が含まれるページ)」と「URL」の間には
        ユーザが「クリックした」という関連ができている
        そう解釈した場合、「妙な単語」と「URL」とを関連づけてくれたのは Google Search だ。
        ユーザーは表示された検索結果の中のどれかをクリックすることしかしていない。
        関連があるという情報を提供したのは Google Search であり、ユーザーは受け手の立場だ。
        そのとき、Bing ツールバーというものが介在して「Google Search からユーザーが
        受取った情報」を傍受し、傍受した情報を参照して Bing の検索結果が改善されてしまった。
        すなわち、Bing ツールバーを使っている無数のユーザーをダシにして、Microsoft が
        多数の Google Search 結果を収集し、Bing の改善に利用したということだ。
        
        これが「泥棒」と呼ばれないとしたら、何が「泥棒」行為に相当するというのだろうか。
        
        シェア
        
        親コメント
        
        Re:割合が低いのでは (スコア:1)
        
        by vn (10720) on 2011年02月04日 0時41分 (#1898165) 日記
        
        馬鹿だなあ君は。
        Google 社が、Google ツールバーのユーザーとの契約上可能なことを、
        他の関係を一切考慮せずになんでもやるわけないじゃないか。
        そんなことをする位なら、いっそ Google に法務部門は要らない。
        
        シェア
        
        親コメント
        
        Re:割合が低いのでは (スコア:1)
        
        by vn (10720) on 2011年02月04日 0時58分 (#1898172) 日記
        
        これは「GoogleやBingがスラドから情報を盗んだ」ことになるの?
        もしもスラドが、数十万以上のキーワードに対して役に立つ検索結果を返すように
        構成されているとしたら、盗んだことになるだろう。辞書を編纂するときに
        他の辞書の説明をコピーしたらアウト。文学作品などから引用するのは OK。
        
        シェア
        
        親コメント
        
        Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)
        
        by taka2 (14791) on 2011年02月04日 12時40分 (#1898420) ホームページ日記
        
        IEのツールバーが情報を送っていたとして、そこからわかるのは
        「mbzrxpgjysを検索した結果のGoogleのページ」から「www.rim.com のページ」に飛んだ
        ということまでです。
        ここで、最近の検索エンジンは、リンク元のページからも www.rim.com に関連するキーワードを抽出しているわけですが、
        検索結果のページに出てくる全ての単語に対し、www.rim.com に関連づけるようなことをしては、まともな検索データベースにはなりません。
        ある程度不要な単語は捨てて、www.rim.com へのリンク部分と密接に関係する単語だけを抽出して関連づける必要があるわけです。
        ところが、Googleの検索結果のページでは、<a href="http://www.rim.com">mbzrxpgjys</a> のような、
        mbzrxpgjys からwww.rim.comを直接関連づけるような部分はありません。www.rim.com へのリンク部分周辺には mbzrxpgjys という単語が出てこない。
        この場合、Bingのクローラは、このページを「検索サイトのページであり、mbzrxpgjysを検索してwww.rim.com という結果が出ている」と認識しないと、
        「mbzrxpgjys」という単語と「www.rim.comというサイト」を関連づけることができないわけです。
        Googleを特別扱いしたかどうかはともかく、「検索結果のページ」という特殊なページ構造に特化した解析ルーチンを持っているのだけは確かでしょう。
        
        シェア
        
        親コメント
        
        Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)
        
        by taka2 (14791) on 2011年02月04日 14時24分 (#1898491) ホームページ日記
        
        「mbzrxpgjysが主題である」ページからのリンクだからというだけで、リンク先の「www.rim.com」も「mbzrxpgjysに関係している」と見なすのは効果が低いかと思います。/.jのトップからリンクされているページは全て「スラッシュドットジャパン」というキーワードに関連づけられているのでしょうか?
        「リンク元のページの主題」と「そのページからのリンク先」を関連づけるというのなら、
        検索結果ページにあるgoogle map など他のサービスへのリンクだとか広告へのリンクも、mbzrxpgjysと関連づけられるはずです。
        直接辿ったという実績情報が無いという点ではランクは下がるかもしれませんけど、まったく一覧に出てこないというのは不可解です。
        ところが、bingでの mbzrxpgjysの検索結果にwww.rim.com以外は現れていません。
        検索結果と認識して無関係なリンクを排除しているとしか思えません。
        
        シェア
        
        親コメント
        
        Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)
        
        by taka2 (14791) on 2011年02月04日 14時57分 (#1898507) ホームページ日記
        
        > Bingが検索結果にGoogle MapやAdWords経由のリンクを表示させないのは当然では?
        でも、Bingで「Map」で検索すると、結果にちゃんと Google Map が表示されますよ。
        Google Map が検索対象になっているのは確かです。
        それなのに、「mbzrxpgjysが主題であるページ」にある
        「<a href="http://maps.google.com>Maps</a>」
        「<a href="http://www.rim.com>RIM Company - Learn…</a>」
        というリンクのうち、前者は無視して後者だけを「mbzrxpgjys」と関連付けてるわけですね。
        
        シェア
        
        親コメント
        
        Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)
        
        by taka2 (14791) on 2011年02月04日 15時38分 (#1898531) ホームページ日記
        
        > "google map など他のサービスへのリンクだとか広告へのリンク"
        > とかそういった単語は他の多くのページでも使われてるでしょ?
        論点がずれています。それは、「mbzrxpgjys以外の単語」からwww.rim.com へのリンクが現れない理由にはなりますが、
        「mbzrxpgjys」という単語から google map へのリンクが現れない理由にはなりません。
        maps.google.com へのリンクが他の多くのページに使われているのと同様に、
        www.rim.com へのリンクも、他のページでも使われていますね。
        そして、「mbzrxpgjys という偽の検索結果からリンクされている」という点だけ見れば、maps.google.com も www.rim.com も同格です。
        
        シェア
        
        親コメント
        
        Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)
        
        by taka2 (14791) on 2011年02月04日 23時35分 (#1898684) ホームページ日記
        
        なんか議論がループしてますが、
        今回の実験の場合、「mbzrxpgjysで検索した結果」はフェイクですが、www.rim.com は実在のサイトです。
        > "mbzrxpgjys" という単語以外と"google map" という単語の関連性が高ければ、
        > "mbzrxpgjys" で検索した結果での google map のランクが高くなるわけないじゃん。
        同様に、
        "mbzrxpgjys" という単語以外と"www.rim.com" という単語の関連性が高ければ、
        "mbzrxpgjys" で検索した結果での www.rim.com のランクが高くなるわけないじゃん。
        とも言えますよ。
        google map と www.rim.com の違いは、
        ・IE toolbar によって「 www.rim.com の方は実際リンクを辿った実績がある」と判明している
        という点ですが、これはBingでの mbzrxpgjys の検索結果で www.rim.com が上位に来る理由にはなるかと思いますが、
        だからといって google map の方が結果に表れないのは、一般的なWeb解析結果と言うには不可解だ、というのが私の主張。
        
        シェア
        
        親コメント
        
        Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)
        
        by taka2 (14791) on 2011年02月04日 23時40分 (#1898685) ホームページ日記
        
        > Google がどういう実験をしたかをよく考えれば
        > "www.rim.com" が優先される理由は自明です。
        いや、単に www.rim.com が優先されるだけなら私も問題視はしません。
        検索結果の画面をよく見ればわかりますが、
        Bingでの「mbzrxpgjys」の検索結果に「1-1 of 1 results」という表記があります。
        つまり、結果に出てるのは www.rim.com だけなんです。
        www.rim.com が1位になるのは分かるが、2位以下に google map が現れていないのは解せないという話。
        
        シェア
        
        親コメント
        
        Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)
        
        by vn (10720) on 2011年02月05日 11時42分 (#1898795) 日記
        
        つまり他の URL が Bing の結果に全く出ないということは、
        純粋に収集した URL のみを利用していて、
        Google 検索結果のページ自体は利用していないから、とも推測できる。
        少なくともこの実験だけで「コピーしてる!」と断定することはできないかと。
        いや、Google Search のユーザーが作り出す URL の遷移記録は、
        Google Search の検索結果を「反映」している。大勢のユーザーの遷移記録を
        集約して、それを元に Bing の検索結果を改善するのは泥棒行為と呼ぶ以外にない。
        
        たとえば、イェール大学の学生100人から講義ノートのコピーを取らせてもらって、
        それを元にして2週間後にはハーバードで別の先生が内容の酷似した講義を行ったとする。
        参考にしたのは講義そのものじゃない、学生が取ったノートだけだから OK だ、などという
        言い訳は通用しないだろう。
        URL 自体に含まれる情報を使うのは OK か、という議論にもなりそうですが、
        これは Google も Toolbar とかで昔っからやってることなので
        Bing だけを一方的に批判するのはずるい気がする。
        Google はツールバーから情報収集しているが、それを用いて
        「他の検索エンジンから結果を盗み取る行為」に手を染めているという証拠は
        今のところない。というより、Google の主張との整合性を期待するならば
        証拠が見つかる可能性はほとんどない。したがって薄弱な根拠から、
        「Google も同じことやってるもん」という小児的な言い訳をすべきではない。
        
        シェア
        
        親コメント
        
        Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)
        
        by vn (10720) on 2011年02月05日 17時13分 (#1898894) 日記
        
        あえて同じような例えをするならば、
        「ハーバードの先生が自分の授業の改善を目的にすることを明確に説明した上で、
        全米・全世界の学生から授業の改善方法を提案してもらった。
        Microsoft 謹製ツールバーのユーザーは、「授業の改善方法を提案」
        に相当する積極的な知的活動を Microsoft に対して行っていない。
        単に自分の URL 遷移記録を Microsoft とシェアしただけだ。ということは、
        そこに他者の知的財産が含まれているかどうか、チェックする段階がない。
        それはツールバーのユーザーの責務ではなく、Microsoft の責務である筈だ。
        しかし Microsoft はその責務を蔑ろにして、遷移記録の集合体の中に混入
        していた Google の知的財産を排除することを怠った。
        さらに Google からその怠慢を指摘されて、まともであれば謝罪して再発防止を
        誓うべきところ、みごとに開き直って Google に泥をなすりつける真似をした。← 今ココ
        
        シェア
        
        親コメント
        
        Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)
        
        by vn (10720) on 2011年02月05日 22時29分 (#1899003) 日記
        
        利用者が知的活動と呼べるような行動をしていないとすれば
        一般的な利用者とは違い、きみは知的活動と呼べるような行動をしていないらしいな。
        寝言にはお付き合いしない。
        
        シェア
        
        親コメント
        
        Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)
        
        by vn (10720) on 2011年02月05日 22時32分 (#1899008) 日記
        
        【あらゆるパブリックなWebサイトに汎用的に適用している単語間の関連抽出アルゴリズム】
        「適用している」の主語を補うべきであり、それはおそらく
        「他者の知的財産権への配慮が不足している検索エンジン業者が」というのがもっともふさわしい。
        
        シェア
        
        親コメント
        
        Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)
        
        by vn (10720) on 2011年02月05日 22時34分 (#1899010) 日記
        
        それはいわゆる「勝利宣言」みたいなものかね? 絵に描いたような詭弁だな。
        
        シェア
        
        親コメント
        
        Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)
        
        by vn (10720) on 2011年02月06日 1時27分 (#1899059) 日記
        
        Google に関する記事へのリンクをたくさん貼ってくれたようだが、
        いずれも「他者の知財への配慮が不足している」裏付けとしては弱過ぎる。
        したがって、私が Google の悪口を言っているという非難は破綻しているようだが如何か。
        
        シェア
        
        親コメント
        
        Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)
        
        by vn (10720) on 2011年02月06日 7時24分 (#1899087) 日記
        
        いずれも「他者の知財への配慮が不足している」裏付けとしては弱過ぎる。
        えっ?
        著作権でも負けてるし、商標権でも負けてるし、特許でも負けてるし、いろいろ他にも係争を抱えてるのに?
        名の通った企業が訴訟に負けるとニュースになる。
        一方で「権利侵害がなかった」という判決を勝ち取ってもニュースにならない。
        だからそれが何? という話だ。
        
        シェア
        
        親コメント
        
        Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)
        
        by vn (10720) on 2011年02月06日 13時27分 (#1899155) 日記
        
        あなたも「他者の知財への配慮が不足している」という点は認めているのですね
        はあ!?
        どうしてそういうバカな解釈が出来るのか、わけがわからん。
        
        シェア
        
        親コメント
        
        Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)
        
        by vn (10720) on 2011年02月06日 16時29分 (#1899213) 日記
        
        さっきバカな解釈と呼んだものが、冗長かつバカな解釈に変わっただけじゃないか。
        1ミリも進歩が見られない。
        
        シェア
        
        親コメント
        
        Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)
        
        by vn (10720) on 2011年02月06日 18時17分 (#1899245) 日記
        
        あなたは「 Google は他者の知財への配慮が不足している」と認識しているのか、
        はいかいいえでお答えください。
        いいえ。
        「いいえ」ならばその理由を説明してください。
        どこかのバカな匿名の臆病者が、私の言葉をうまく解釈できない。
        じゃあ仕方ないでしょう。間違った解釈をバカみたいに繰り返すのをやめて、
        愚か者にふさわしく沈黙すればいいのに。
        
        シェア
        
        親コメント
ああそれは (スコア:0)

by Anonymous Coward on 2011年02月03日 18時37分 (#1897949)

ちゃんとロボット避けしてないからだな。
NOINDEXてちゃんと入っている？
#Bingの検索はGoogleを避けるとは成って無いだろうからね。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  タレコミのどこにロボットの話が出ているのか？
  > BingツールバーがインストールされたIEを使い
  って書いてあるぜ。
- Re:これは Google のいいがかり (現状では) (スコア:2)
  
  by kcg (26566) on 2011年02月04日 8時13分 (#1898267) ホームページ日記
  
  検索結果ページには、サイトへのリンクの下に検索ワードに強く関連する文章が少し表示されますが、
  このリンク先ページの関連文章部分についてはどういう解釈？
  ワードが実際に含まれているページであれは、そのワードを含んでいる文章の前後が適当に切り取られて表示されます。
  ワードが一切含まれていないページも、クリックなどの関連性から検索結果としているという今回の場合。
  ページ内のどの部分の文章がマッチしたのかは
  Bingが実際にページを取得してワードが示している部分を決定するべき部分でしょう。
  それが、Googleが嘘で適当に表示した嘘文章と、一字一句違わなかった理由はどういう説明ができるのでしょうか？
  
  シェア
  
  親コメント
- - Re:他の検索エンジンでも... (スコア:1)
    
    by digoh (17917) on 2011年02月04日 11時02分 (#1898347) 日記
    
    Yahoo!の結果はGoogleのパクり！
    ですよねー
    
    シェア
    
    親コメント

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

Bingに「Googleの検索結果を盗んでいる」疑惑が浮上 More ログイン

問題あるの? (スコア:3, すばらしい洞察)

どこがポイントなのか (スコア:3, 興味深い)

Re:どこがポイントなのか (スコア:2)

Re:どこがポイントなのか (スコア:1)

Re:どこがポイントなのか (スコア:1)

Re:どこがポイントなのか (スコア:2)

偽Googleを用意すべきだったかもね (スコア:1)

Googleが懲りすぎたのが敗因ですね (スコア:2, すばらしい洞察)

Re:Googleが懲りすぎたのが敗因ですね (スコア:2)

辞書の不正コピー対策 (スコア:2)

Bingを叩いてる暇があったら (スコア:0)

Re:Bingを叩いてる暇があったら (スコア:1, 参考になる)

なんとかツールバーってそういうもんだろw (スコア:0)

０件だと… (スコア:0)

オプトアウト (スコア:0)

Re:オプトアウト (スコア:1)

Re:オプトアウト (スコア:1)

Re:オプトアウト (スコア:2, すばらしい洞察)

おとりなんてめんどくさいことせんでも... (スコア:0)

割合が低いのでは (スコア:0)

Re: (スコア:0)

Re:割合が低いのでは (スコア:2, 興味深い)

Re:割合が低いのでは (スコア:2)

Re:割合が低いのでは (スコア:1)

Re:割合が低いのでは (スコア:1)

Re:割合が低いのでは (スコア:1)

Re:割合が低いのでは (スコア:1)

Re:割合が低いのでは (スコア:1)

Re:割合が低いのでは (スコア:1)

Re:割合が低いのでは (スコア:1)

Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)

Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)

Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)

Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)

Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)

Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)

Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)

Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)

Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)

Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)

Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)

Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)

Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)

Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)

Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)

Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)

ああそれは (スコア:0)

Re: (スコア:0)

Re:これは Google のいいがかり (現状では) (スコア:2)

Re:他の検索エンジンでも... (スコア:1)