パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

Bingに「Googleの検索結果を盗んでいる」疑惑が浮上」記事へのコメント

  • by Anonymous Coward
    Googleが作った約100個の罠のうち、Bingに反映された(Googleの主張では盗まれた)のはたった7~9個。
    わずか1割にも満たない結果を持ってこの主張をするのはちょっと苦しいのでは。
    • by Anonymous Coward

      でも存在しない単語の検索結果はどこから生まれたの?
      なぜそれが人為的に作られた Google のそれと一致するの?

      #お前が無くした約100本のボールペンのうち、上司の机から出てきた(お前の主張では盗まれた)のはたった7~9本。
      #わずか1割にも満たない結果を持ってこの主張をするのは(略

      • by Anonymous Coward on 2011年02月03日 19時06分 (#1897972)

        「Googleの検索結果画面から結果を直接的に複製した」なら問題だけど、
        「(偶然Google経由で、偶然Google経由でしか辿り着けない)とあるページを閲覧し、
        そのURLがBingツールバーの機能としてユーザの同意を得てMSに送信され、
        それを後からBingのロボットがクロールし、その中に含まれていた妙な単語をBingが新規語として認識し、
        Bing側でも検索結果に含まれるようになった」なら、何の問題もない。

        Googleが表示していた検索結果のうちわずかしかBing側に含まれてないというのが事実なら、
        裏で起きていたことが前者じゃなく後者であったということを示唆するように、自分には思える。

        ドメインすら違うURLを「Google経由で検索して辿り着いたから」というだけの理由で
        Bingがクロール遠慮する必要はないでしょ?
        Googleの検索結果に表示されるページは全部Googleのものだと言いたいなら、とんだジャイアニズムだ。

        親コメント
        • by Deasuke (34806) on 2011年02月03日 22時36分 (#1898094) 日記
          clickstreamという名前からの妄想ですが、
          IEツールバーで検索語を入力して表示したページ(普通は何らかの検索エンジンの検索結果)でどこをクリックしたか?という情報だと思われます。すなわち、
          「<検索語> <クリックされたURI> <カウント(頻度)> 」と言うペアからなるデータが保存されている訳です。
          (これらの情報はIE8(9)のインストール時あるいは初回起動時あるいはツールバーの初回起動時に、送信許可を求めるダイアログが出るんだったと思います)

          今回のグーグルの「実験」は「<特定の検索語(滅茶苦茶な綴り)> <グーグルの用意した検索結果>」というペアをIEツールバー(またはそのエミュレータ)を用いて
          マイクロソフトに大量に送り付けたものと考えられます。

          公式見解
          http://www.bing.com/community/site_blogs/b/search/archive/2011/02/01/thoughts-on-search-quality.aspx
          によると、1000以上のシグナルを用いて表示されるページの順位を決めているとありますが、おそらく滅茶苦茶な綴りの文字列を検索語とした場合、
          通常考えられるシグナルは全く反応しないことが想像されます。とすると、グーグルの「実験」によって送られた偽のclickstreamのみのシグナルが
          残り、グーグルが用意した検索結果が検索される、ということです。

          従って、(clickstream以外のシグナルが殺されるような検索語の場合)例えばグーグルの結果で3番目に表示されたものが最もクリックの頻度が高ければ、
          bingで一位になるのはグーグルでは3番目の結果であると想像されます。すなわちグーグルの結果とは表示順位が異なる可能性もあり、グーグルの結果
          のコピーとは異なります。

          これは、滅茶苦茶な綴りであれば簡単にSEOできてしまう脆弱性と考えられますから、「clickstream以外のシグナルが殺された場合は反応しない」
          と言った対策が取られると想像されるのでもう検証はできないと思いますが、もしMSがこの脆弱性を放置するなら、以下の方法で私の妄想は確認できます。

          1. 適当にbingにindexされているURIを選択する。適当な単語でbingで検索した結果の(例えば1位の)URIを記録すれば良い。
          2. 滅茶苦茶な綴りの単語を用意する(アルファベットが望ましい。日本語だと形態素解析のために複数の単語と認識される可能性が高いため)
          3. 俺俺検索エンジンを作る。仕様は2.の検索語を入力すれば1.のURIが検索結果として表示されるものであれば良い。簡単なCGIでOK
          4. 3をIEのツールバーに登録し、2.の検索語で検索し、出てきた検索結果をクリックして1.のURIに飛ぶ
          (4.については沢山のコンピュータで沢山やる必要があるかもです)

          これで、しばらくすると<2の検索語>で<1のURI>がbingの検索結果に現われるのであれば、「bingは俺俺検索エンジンのコピーだ」と主張できます。

          本当かな?
          --
          Best regards, でぃーすけ
          親コメント
          • by kousokubus (37099) on 2011年02月04日 0時36分 (#1898163)

            たぶんそれでしょうな。
            検索して移動したっていう情報のみがシグナルとして残れば、それが出てくるってのはありがち。
             # Amazonの「コレを買った人はコレも買っています」もレアな組み合わせにお目にかかったりする。ACアダプタとオムツとか:-P
             # クリックの流れ(検索して移動→クリックして移動→クリックして移動→クリックして移動……)をclickstreamと呼ぶのはありそう。

            で、たぶんそこまではGoogleもMicrosoftも争ってないと思う。
            問題は、その「検索単語と、その先のリンク」の流れがアリなのかどうかって所だと思う。
            これってたぶんGoogle狙い撃ちって言うよりは、AmazonとかeBayとかも検索単語とそのクリック先をペアで拾ったりしてそう。
            それは良いのか?ってところ。(Googleは駄目だって言ってて、MSはシグナルの一つって言ってる)
            検索単語とその結果のクリック先を覚えるのは、アリかナシかって話であって、シグナルの1つで割合が少ないから良いって話でもなさそーな。
             # 間違った単語での「もしかして...では?」と上位の結果が同じになるって事は、シグナルの重み付けも結構高そう

            使える情報をうまく使っているのか、他サービスの検索単語とその結果を掠め盗ってるのか……
            例えばオレオレ検索エンジンが、自分の仲間内でしか公開してない「slashdotのユーザ名を入れるとリアル勤務先サイトが出る」検索エンジンだったとして、
            仲間内で何度も使ってるうちに、いつの間にかBing検索でも同じ結果がでるようになったら、コピーされた!と思うんじゃないかな。
             # 検索エンジンのキモは検索単語と検索結果順位だと思うので。
             # 微妙なラインだけど、検索単語とそのクリック先ペアは、明らかに検索結果になるって判ってるんだからやっちゃ駄目な気はするなあ

            親コメント
            • by Anonymous Coward

              「検索単語と、その先のリンク」の流れがアリなのかどうかって所だと思う。

              「検索単語」じゃなくて、「リンク元のページ (検索結果を表示するページ) に含まれていた単語」ね。
              # もちろん普通の検索エンジンでは「リンク元のページ (検索結果を表示するページ)」には「検索単語」が含まれている。

              AmazonとかeBayとかも検索単語とそのクリック先をペアで拾ったりしてそう。
              それは良いのか?ってところ。(Googleは駄目だって言ってて、MSはシグナルの一つって言ってる)

              # 「検索単語」は「リンク元のページ (検索結果を表示するページ)に含まれていた単語」と読

              • by Anonymous Coward

                お前いい加減臭いよ。ACで発言しづらくなるから止めてくんない?
                「検索単語」も「リンク元のページ (検索結果を表示するページ) に含まれていた単語」も妄想でしかないだろ。
                断言してる分お前のがタチ悪いよ。巣に帰れ。

              • by Anonymous Coward
                それって敗北宣言?

                元コメントのどこがどう何を断言してるのかわかりませんが?

                妄想してるのはどっち?
        • by vn (10720) on 2011年02月03日 19時27分 (#1897988) 日記

          それを後からBingのロボットがクロールし、その中に含まれていた妙な単語をBingが新規語として認識し、

          それは Google が実験したこととは異なる。
          Google で「妙な単語」を検索すると、ある URL が表示される。
          その URL は実在するウェブページを指しているが、その中をいくら調べても
          「妙な単語」はそこには存在していない。
          つまり、「妙な単語」と「URL」とを関連づける情報は Google Search の中にしかない。

          これでは、「Bing は Google Search の出力結果を参照して出力を改善している」と
          非難されても止むを得ない。

          親コメント
          • by Anonymous Coward

            逆に、この手法を使えばBingの検索精度を下げることが出来るってんじゃねぇの?
            googleの主張が正しければw

          • by Anonymous Coward

            ああなるほどね。ちょっと勘違いしてた。
            まあでも、Googleだって検索語そのものが含まれていないページの検索結果を出すことはしょっちゅうあるよね。

            最近の検索エンジンは内部に含まれている単語だけのインデックス化だけではなく、類義語や地理情報も含めた総合的な判定をしているから、『リンク情報を見るとその単語とそのページとはとても密接に関わっている』というだけで、検索結果のトップに出てくることは多い。
            例えば「ぐぐる」や「ようつべ」で検索したら「もしかして」とも言わずにGoogleやYouTubeがトップページに出てくるとか、 あだ名だけ [google.co.jp]で芸能

            • by vn (10720) on 2011年02月03日 20時34分 (#1898028) 日記
              未知の単語についてすら、Bing は Google Search の出力結果を参照していると証明された。
              いわんや既知の単語においておや、参照していませんとシラを切るのは非常に難しい。

              というわけで "Bing - Powered by Google" の尊称を奉ろう。
              親コメント
              • by Anonymous Coward

                いや「参照してません」なんて言ってないし、しらを切る必要なんてどこにもないでしょ。
                「参照はするけど、それは単なる普通のWebページの1つとしてGoogleの検索結果も取り扱った結果であり、Googleを狙って意図的に情報を抜くような実装は一切してない」ってこと。

                そこでGoogleが「Googleの検索結果だけにしかその単語と囮ページを結びつける情報がない」という、普通ならあり得るはずのない状況を無理矢理作り出し、その結果で「"意図的に"Googleを狙って情報をブッコ抜いた」ような印象を植え付ける主張をしてるの。Googleによる印象操作の感がぬぐえない。
                Bingにとっては、「新規の単語が出現し、著名なサイトがその新規の単語で特定のページにリンクしている」という情報が欲しいだけ。「それがGoogleの検索結果だけにしか出現しない」なんていう迷惑極まり無い状況は、まさか想定してなかったんだろう。

              • by vn (10720) on 2011年02月04日 0時15分 (#1898152) 日記

                「参照はするけど、それは単なる普通のWebページの1つとしてGoogleの検索結果も取り扱った結果であり、Googleを狙って意図的に情報を抜くような実装は一切してない」ってこと。

                仮にこれが Microsoft の公式見解であるとしよう。
                零細な検索エンジン業者にとっては大変な朗報だ。なにしろ Microsoft が大枚はたいて作った
                Bing の検索結果が、「普通のWebページの1つ」として参照できる。ほとんど盗み放題だ。
                (数百万人のクリックストリームを取得することは、競争力のある検索エンジンの開発コストに
                比べれば無視できる程度のものだ。)
                ただし Microsoft には文句を言う権利がないとしても、もともと盗まれている Google から
                非難されることは覚悟せねばなるまい。

                親コメント
              • by cv (41694) on 2011年02月04日 0時54分 (#1898170)

                >いや「参照してません」なんて言ってないし、しらを切る必要なんてどこにもないでしょ。

                そう思う。
                検索エンジンが検索の対象になってもおかしくはないと思うんだけどね。
                検索エンジンって、そもそもそこらじゅうにあるモノを検索して集めるわけで、何も、他の公開されている検索エンジンを対象外にするルールがあるわけでもないと思うね。

                カンニングとか言っていても、探し得る情報を収集するといことで、まっとうな事だと思うけどね。

                検索エンジンって、集めた情報の量だけではなくて、料理の仕方(並べ方取捨選択)が結構重要で、その後者について追いつかれそうなGoogleの焦りみたいなものを感じます。

                親コメント
            • by Anonymous Coward

              Bingは「Googleの検索結果ページからのリンクを無理に除外せず、判断に含めてしまった」のかもしれないけど、それがどこまで悪なのかについて明確なルールなんてあるのかな。Googleの検索画面だってWebページの一種なんだから、「どの単語とどのページが関連しているか」の判断基準には(意図的に除外しない限り)含まれることになるし、検索結果を直接的に盗用したつもりでなくても同様の結果は出てくる。

              えーと、それはつまり……
              「IE(もしくはBingツールバー)は、ユーザが表示したWebページ中の情報をMicrosoftに送信している」
              ってこと!?

              それは「Googleの検索結果横取り」なんて目じゃない悪質行為ではないですか?

              • by Anonymous Coward

                面倒だけどBingバーのインストーラを立ち上げて確認してみた。
                ちゃんと
                「お客様のシステム構成、検索結果、アクセスしたWebサイト(中略)などの情報をマイクロソフトに提供することにより(中略)製品およびサービスの向上に役立てます」という
                チェックボックスがあった。
                デフォルトで有効ではあるけど、少しでもその辺を気にする人なら見逃さない程度には分かりやすいしから、大してあくどいとは思えない程度だった。

                そんなことより、「どこでもこの程度やってる」という認識がなさそうな、元コメの自己防衛意識の低さの方がちょっと心配になる。

              • by Anonymous Coward

                えーと、それはつまり…… 「IE(もしくはBingツールバー)は、ユーザが表示したWebページ中の情報をMicrosoftに送信している」 ってこと!? それは「Googleの検索結果横取り」なんて目じゃない悪質行為ではないですか?

                Google ツールバー プライバシーポリシー [google.com]より:

                拡張機能が有効になっている場合、Google は、表示中のウェブページに関する情報を収集できます。この機能はオプションであり、Google ツールバーの [Google] メニューで [プライバシーについて] を選択することによりいつでも有効/無効を切り替えることができます。

                今すぐ設定を確認したほうが良いですよ!

          • by Anonymous Coward

            つまり、「妙な単語」と「URL」とを関連づける情報は Google Search の中にしかない。

            ダウト

            今回の実験では

            Googleでこの言葉を検索した上で検索結果として表示されるおとりページをクリックしたところ

            という実験をしているので「Googleの検索結果のページ (つまり「妙な単語」が含まれるページ)」と「URL」の間には
            ユーザが「クリックした」という関連ができている (Bing のツールバーに(わざと?)ユーザの行動履歴を収集させている)。

            この件はほぼ間違いなく Google のいいがかりでしょう。
            それどころか、Google Toolbar も (PageRank とか表示するように設定してると) ユーザの行動履歴を収集しているわけだから、
            Microsoft に同様の実験をされたらブーメランがかえってくる可能性が高そう。

            • by vn (10720) on 2011年02月03日 23時55分 (#1898139) 日記

              「Googleの検索結果のページ (つまり「妙な単語」が含まれるページ)」と「URL」の間には
              ユーザが「クリックした」という関連ができている

              そう解釈した場合、「妙な単語」と「URL」とを関連づけてくれたのは Google Search だ。
              ユーザーは表示された検索結果の中のどれかをクリックすることしかしていない。
              関連があるという情報を提供したのは Google Search であり、ユーザーは受け手の立場だ。
              そのとき、Bing ツールバーというものが介在して「Google Search からユーザーが
              受取った情報」を傍受し、傍受した情報を参照して Bing の検索結果が改善されてしまった。
              すなわち、Bing ツールバーを使っている無数のユーザーをダシにして、Microsoft が
              多数の Google Search 結果を収集し、Bing の改善に利用したということだ。

              これが「泥棒」と呼ばれないとしたら、何が「泥棒」行為に相当するというのだろうか。

              親コメント
              • by Anonymous Coward

                これが「泥棒」と呼ばれないとしたら、何が「泥棒」行為に相当するというのだろうか。

                じゃあ Google も泥棒だね。

                ああ君はわかりやすく説明しないと理解できないかな。
                まずGoogle ツールバー プライバシーポリシー [google.com]を見て欲しい。

                拡張機能が有効になっている場合、Google は、表示中のウェブページに関する情報を収集できます。この機能はオプションであり、Google ツールバーの [Google] メニューで [プライバシーについて] を選択することによりいつでも有効/無効を切り替えることができます。

                君の愛する Google は Bing に断わりもなく無数のユーザの Bing の検索結果を勝手に収集しているみたいだぞ!

                話はこれで終わらないぞ。

              • by Anonymous Coward

                スラドとか各所の掲示板でRjeallkzznewwetter [nhk.or.jp]という単語をNHKにリンクしまくり、
                1週間後にGoogleやBingの検索結果でRjeallkzznewwetterを検索するとNHKが上位に出てくるようになった場合、
                これは「GoogleやBingがスラドから情報を盗んだ」ことになるの?
                それを情報の泥棒だと呼ぶなら、世の中の検索エンジンのアルゴリズムの前提が全部崩壊するのは分かるよね?

                今回はそれが偶然Googleの検索結果ページだったわけだ。何しろそこにしか出さないというあり得ない状況を、
                意図的にGoogleが仕組んだんだから、Bingとしてはそれ以外に参考に出来る情報なんて何にもない。
                なんでその場合に限ってGoogleから泥棒されたとか言わなきゃいけないの?

              • by vn (10720) on 2011年02月04日 0時41分 (#1898165) 日記
                馬鹿だなあ君は。
                Google 社が、Google ツールバーのユーザーとの契約上可能なことを、
                他の関係を一切考慮せずになんでもやるわけないじゃないか。
                そんなことをする位なら、いっそ Google に法務部門は要らない。
                親コメント
              • by Anonymous Coward
                おいおい反論が短すぎて少々がっかりさせられたよ…

                Google 社が、Google ツールバーのユーザーとの契約上可能なことを、
                他の関係を一切考慮せずになんでもやるわけないじゃないか。

                いやー危ない危ない。
                支離滅裂フィルターで破棄しちゃうところだったけど
                頑張ってできる限り理解に努めてみたよ!
                つまり君が愚かな僕に何とか伝えようとしてくれたのは、

                「俺の愛する Google がそんなひどいことするわけないよ!」

                ということだけだよね? OK? いいんじゃないかな、それで [google.co.jp]

              • by vn (10720) on 2011年02月04日 0時58分 (#1898172) 日記

                これは「GoogleやBingがスラドから情報を盗んだ」ことになるの?

                もしもスラドが、数十万以上のキーワードに対して役に立つ検索結果を返すように
                構成されているとしたら、盗んだことになるだろう。辞書を編纂するときに
                他の辞書の説明をコピーしたらアウト。文学作品などから引用するのは OK。

                親コメント
              • by Anonymous Coward

                もしもスラドが、数十万以上のキーワードに対して役に立つ検索結果を返すように構成されているとしたら、盗んだことになる

                検索機能のあるサイトかどうかは重要ではないでしょ。それは論点が全く違う。だいたい検索機能の有る情報サイトをインデックスして盗用だというなら、Googleが難しい単語に対してWikipediaや英和辞書サイトの記事を上位に表示してくるのも全部剽窃になるぞ。

                そうじゃなくて、今の問題はあくまで、リンク情報やページ遷移情報。
                BingがクエリをそのままGoogleに投げてその結果をオウム返ししてるとかなら泥棒だけど、ユーザのページ遷移の

              • 今までのレスとは違う人ですけど

                Bingが「これは知らないページだぞ、ユーザはどうしてどんなページに辿り着いたんだろう」と思ったときに、リンク元を辿ったら偶然Googleだとしても、なぜそこで解析を中断する必要があるの?

                Googleを特別扱いしなければ移動元(Google検索)と移動先の関連はURLで言えば
                1. www.google.com/search?q=検索文字列&ie=文字コード&検索ソース
                2. www.rim.com
                Bingには上記の関連性しか送られない。

                しかし mbzrxpgjys 文字列を「Google」とか「文字コード」の除外でBing検索してもおそらくヒットする事になると思われます。
                つまりGoogle検索であることを特別視して「検索文字列」を抜き出してBing検索に利用してるって事になりませんか?

                # 100%悪だとは思わないがやっぱまずいだろうとは思う。

              • by Anonymous Coward

                いやリンク元のURLだけを見てるんじゃなくて、リンク元のページの内容そのもの(ユーザが実際に見ているもの)を解析してますよ。だいたいユーザはURLを読んでるわけじゃないのに、URL文字列自体を解析するなんていう鈍くさい実装をして誰の役に立つんですか。

                別にリンク元のページ内容が検索エンジンの結果画面であるかどうかなんて認識する必要がありません。アルゴリズム上、それだけ特別視する意味は何らありません。大事なことは、リンク元となったページにはBingにとって見慣れない「妙な単語」があると認識でき、その妙な単語は、今のところwww.rim.com

              • by Anonymous Coward

                しかし mbzrxpgjys 文字列を「Google」とか「文字コード」の除外でBing検索してもおそらくヒットする事になると思われます。

                それは Bing が Google を特別扱いしている証拠にはなり得ない。
                "mbzrxpgjys" などという単語は他にはどこにも存在していなかった単語なのだから。
                もしも「文字コード」や「Google」という文字列が他にどこにも存在していないか、
                もしくはそれらの文字列を含む URL やページの全てがリンク先 "www.rim.com" と関連していたとしたら、
                「Google」という語だ

              • IEのツールバーが情報を送っていたとして、そこからわかるのは
                「mbzrxpgjysを検索した結果のGoogleのページ」から「www.rim.com のページ」に飛んだ
                ということまでです。
                ここで、最近の検索エンジンは、リンク元のページからも www.rim.com に関連するキーワードを抽出しているわけですが、
                検索結果のページに出てくる全ての単語に対し、www.rim.com に関連づけるようなことをしては、まともな検索データベースにはなりません。
                ある程度不要な単語は捨てて、www.rim.com へのリンク部分と密接に関係する単語だけを抽出して関連づける必要があるわけです。

                ところが、Googleの検索結果のページでは、<a href="http://www.rim.com">mbzrxpgjys</a> のような、
                mbzrxpgjys からwww.rim.comを直接関連づけるような部分はありません。www.rim.com へのリンク部分周辺には mbzrxpgjys という単語が出てこない。

                この場合、Bingのクローラは、このページを「検索サイトのページであり、mbzrxpgjysを検索してwww.rim.com という結果が出ている」と認識しないと、
                「mbzrxpgjys」という単語と「www.rim.comというサイト」を関連づけることができないわけです。
                Googleを特別扱いしたかどうかはともかく、「検索結果のページ」という特殊なページ構造に特化した解析ルーチンを持っているのだけは確かでしょう。

                親コメント
              • by Anonymous Coward

                ある程度不要な単語は捨てて、www.rim.com へのリンク部分と密接に関係する単語だけを抽出して関連づける必要があるわけです。

                "mbzrxpgjys" という新しい単語が現れているので、「不要」とみなされなかっただけでは。

              • by Anonymous Coward

                単語同士の関連を抽出するのが目的なら、そのページの主題がmbzrxpgjysである可能性が高いと汎用的に認識できれば十分であり、他社の検索結果ページであるとまで認識する意味はない。そのルーチンが「検索エンジンとはっきり認識してるに違いない」まで言い切っちゃうのは無理があるかと。
                そして少なくともmbzrxpgjysでググった結果ページの<title>タグ内に、もろmbzrxpgjysが出てくるんだから、それだけで簡単にmbzrxpgjysについてのページだと分かる。
                まあ裏でどんな解析してるのかの詳細は検索サイトにとってトップシークレット(ばらしたらランク操作される)だから、これ以上は誰にも否定も肯定もできない気がする。

                まあ、どこかで検索ページを検索ページと認識してること自体は確か。Bingの検索結果にGoogleの検索結果ページ自体は決して出てこない、とか、そういう除外は当然してるよね。

              • 「mbzrxpgjysが主題である」ページからのリンクだからというだけで、リンク先の「www.rim.com」も「mbzrxpgjysに関係している」と見なすのは効果が低いかと思います。/.jのトップからリンクされているページは全て「スラッシュドットジャパン」というキーワードに関連づけられているのでしょうか?

                「リンク元のページの主題」と「そのページからのリンク先」を関連づけるというのなら、
                検索結果ページにあるgoogle map など他のサービスへのリンクだとか広告へのリンクも、mbzrxpgjysと関連づけられるはずです。
                直接辿ったという実績情報が無いという点ではランクは下がるかもしれませんけど、まったく一覧に出てこないというのは不可解です。
                ところが、bingでの mbzrxpgjysの検索結果にwww.rim.com以外は現れていません。

                検索結果と認識して無関係なリンクを排除しているとしか思えません。

                親コメント
              • by Anonymous Coward

                Bingが検索結果にGoogle MapやAdWords経由のリンクを表示させないのは当然では?

                GoogleはToolbarなどで履歴を取得するとき、他の検索エンジン経由で遷移したユーザーの行動履歴を排除しているのでしょうか?

              • > Bingが検索結果にGoogle MapやAdWords経由のリンクを表示させないのは当然では?

                でも、Bingで「Map」で検索すると、結果にちゃんと Google Map が表示されますよ。
                Google Map が検索対象になっているのは確かです。

                それなのに、「mbzrxpgjysが主題であるページ」にある
                「<a href="http://maps.google.com>Maps</a>」
                「<a href="http://www.rim.com>RIM Company - Learn…</a>」
                というリンクのうち、前者は無視して後者だけを「mbzrxpgjys」と関連付けてるわけですね。

                親コメント
              • by Anonymous Coward

                検索結果ページにあるgoogle map など他のサービスへのリンクだとか広告へのリンクも、mbzrxpgjysと関連づけられるはずです。

                まだ分かってないようですね。
                "google map など他のサービスへのリンクだとか広告へのリンク"
                とかそういった単語は他の多くのページでも使われてるでしょ?

                でも今回の "mbzrxpgjys" は、偽の検索結果にしかあらわれてないわけ。
                だから関連性が相対的に高いと判断しても全然不自然じゃない。
                分かりました?

              • > "google map など他のサービスへのリンクだとか広告へのリンク"
                > とかそういった単語は他の多くのページでも使われてるでしょ?

                論点がずれています。それは、「mbzrxpgjys以外の単語」からwww.rim.com へのリンクが現れない理由にはなりますが、
                「mbzrxpgjys」という単語から google map へのリンクが現れない理由にはなりません。

                maps.google.com へのリンクが他の多くのページに使われているのと同様に、
                www.rim.com へのリンクも、他のページでも使われていますね。

                そして、「mbzrxpgjys という偽の検索結果からリンクされている」という点だけ見れば、maps.google.com も www.rim.com も同格です。

                親コメント
              • by Anonymous Coward

                「mbzrxpgjys という偽の検索結果からリンクされている」という点だけ見れば、maps.google.com も www.rim.com も同格です。

                肝心なところを忘れてませんかね。
                機械的な関連づけに限界があるからこそ、「何とかツールバー」系はユーザのクリック履歴や画面遷移履歴を取るんだし、Googleの人たちはわざわざ20台ものPCを使って「mbzrxpgjysが主題のページ」から「rim.com」へリンクしたという大量の履歴をBingツールバーを通じてMSに送信しまくったんでしょ。
                「mbzrxpgjysが主題のページ」をBingツールバーに1回見せただけじゃmbzrxpgjysとrim.comと関連を認識しなかった、ということは、Google自身が認めてるじゃないですか。大量のPCを使いました~と言ってる。

                MSも主張していますが、こういうのは、Googleじゃなくて別の会社が自社の利益のためにやったなら、本来ハックとかランク操作と言われて全く問題ないレベルの行為ですよね。

              • なんか議論がループしてますが、
                今回の実験の場合、「mbzrxpgjysで検索した結果」はフェイクですが、www.rim.com は実在のサイトです。

                > "mbzrxpgjys" という単語以外と"google map" という単語の関連性が高ければ、
                > "mbzrxpgjys" で検索した結果での google map のランクが高くなるわけないじゃん。

                同様に、

                  "mbzrxpgjys" という単語以外と"www.rim.com" という単語の関連性が高ければ、
                  "mbzrxpgjys" で検索した結果での www.rim.com のランクが高くなるわけないじゃん。

                とも言えますよ。

                google map と www.rim.com の違いは、
                ・IE toolbar によって「 www.rim.com の方は実際リンクを辿った実績がある」と判明している
                という点ですが、これはBingでの mbzrxpgjys の検索結果で www.rim.com が上位に来る理由にはなるかと思いますが、
                だからといって google map の方が結果に表れないのは、一般的なWeb解析結果と言うには不可解だ、というのが私の主張。

                親コメント
              • > Google がどういう実験をしたかをよく考えれば
                > "www.rim.com" が優先される理由は自明です。

                いや、単に www.rim.com が優先されるだけなら私も問題視はしません。

                検索結果の画面をよく見ればわかりますが、
                Bingでの「mbzrxpgjys」の検索結果に「1-1 of 1 results」という表記があります。
                つまり、結果に出てるのは www.rim.com だけなんです。

                www.rim.com が1位になるのは分かるが、2位以下に google map が現れていないのは解せないという話。

                親コメント
              • つまり他の URL が Bing の結果に全く出ないということは、
                純粋に収集した URL のみを利用していて、
                Google 検索結果のページ自体は利用していないから、とも推測できる。
                少なくともこの実験だけで「コピーしてる!」と断定することはできないかと。

                いや、Google Search のユーザーが作り出す URL の遷移記録は、
                Google Search の検索結果を「反映」している。大勢のユーザーの遷移記録を
                集約して、それを元に Bing の検索結果を改善するのは泥棒行為と呼ぶ以外にない。

                たとえば、イェール大学の学生100人から講義ノートのコピーを取らせてもらって、
                それを元にして2週間後にはハーバードで別の先生が内容の酷似した講義を行ったとする。
                参考にしたのは講義そのものじゃない、学生が取ったノートだけだから OK だ、などという
                言い訳は通用しないだろう。

                URL 自体に含まれる情報を使うのは OK か、という議論にもなりそうですが、
                これは Google も Toolbar とかで昔っからやってることなので
                Bing だけを一方的に批判するのはずるい気がする。

                Google はツールバーから情報収集しているが、それを用いて
                「他の検索エンジンから結果を盗み取る行為」に手を染めているという証拠は
                今のところない。というより、Google の主張との整合性を期待するならば
                証拠が見つかる可能性はほとんどない。したがって薄弱な根拠から、
                「Google も同じことやってるもん」という小児的な言い訳をすべきではない。

                親コメント
              • あえて同じような例えをするならば、
                「ハーバードの先生が自分の授業の改善を目的にすることを明確に説明した上で、
                全米・全世界の学生から授業の改善方法を提案してもらった。

                Microsoft 謹製ツールバーのユーザーは、「授業の改善方法を提案」
                に相当する積極的な知的活動を Microsoft に対して行っていない。
                単に自分の URL 遷移記録を Microsoft とシェアしただけだ。ということは、
                そこに他者の知的財産が含まれているかどうか、チェックする段階がない。
                それはツールバーのユーザーの責務ではなく、Microsoft の責務である筈だ。
                しかし Microsoft はその責務を蔑ろにして、遷移記録の集合体の中に混入
                していた Google の知的財産を排除することを怠った。
                さらに Google からその怠慢を指摘されて、まともであれば謝罪して再発防止を
                誓うべきところ、みごとに開き直って Google に泥をなすりつける真似をした。← 今ココ

                親コメント
              • 利用者が知的活動と呼べるような行動をしていないとすれば

                一般的な利用者とは違い、きみは知的活動と呼べるような行動をしていないらしいな。
                寝言にはお付き合いしない。

                親コメント
              • 【あらゆるパブリックなWebサイトに汎用的に適用している単語間の関連抽出アルゴリズム】

                「適用している」の主語を補うべきであり、それはおそらく
                「他者の知的財産権への配慮が不足している検索エンジン業者が」というのがもっともふさわしい。

                親コメント
              • それはいわゆる「勝利宣言」みたいなものかね? 絵に描いたような詭弁だな。
                親コメント
              • Google に関する記事へのリンクをたくさん貼ってくれたようだが、
                いずれも「他者の知財への配慮が不足している」裏付けとしては弱過ぎる。
                したがって、私が Google の悪口を言っているという非難は破綻しているようだが如何か。
                親コメント
              • いずれも「他者の知財への配慮が不足している」裏付けとしては弱過ぎる。

                えっ?
                著作権でも負けてるし、商標権でも負けてるし、特許でも負けてるし、いろいろ他にも係争を抱えてるのに?

                名の通った企業が訴訟に負けるとニュースになる。
                一方で「権利侵害がなかった」という判決を勝ち取ってもニュースにならない。
                だからそれが何? という話だ。

                親コメント
              • あなたも「他者の知財への配慮が不足している」という点は認めているのですね

                はあ!?
                どうしてそういうバカな解釈が出来るのか、わけがわからん。

                親コメント
              • さっきバカな解釈と呼んだものが、冗長かつバカな解釈に変わっただけじゃないか。
                1ミリも進歩が見られない。
                親コメント
              • あなたは「 Google は他者の知財への配慮が不足している」と認識しているのか、
                はいかいいえでお答えください。

                いいえ。

                「いいえ」ならばその理由を説明してください。

                どこかのバカな匿名の臆病者が、私の言葉をうまく解釈できない。
                じゃあ仕方ないでしょう。間違った解釈をバカみたいに繰り返すのをやめて、
                愚か者にふさわしく沈黙すればいいのに。

                親コメント
          • by Anonymous Coward
            アンカータグの中身とURL先情報を関連付けして収集してるだけなんじゃね?
        • by Anonymous Coward

          > その中に含まれていた妙な単語をBingが新規語として認識し、Bing側でも検索結果に含まれるようになった

          いや、Googleが出した偽検索結果から指されるページには、その結果を出すきっかけとなった単語は含まれていなかったんよ。
          そのページだけじゃなく、そのページにリンクしてるあらゆる他のページにもね。その検索語とページを
          結びつける情報はこの世の中でGoogleの偽検索結果のページだけ、という状態を作り出したわけ。

          「BingがクロールしたのがGoogleの偽検索結果そのものだった」っていう主張なら、そりゃ
          Googleの検索結果を利用してるって言えなくはない。

          でも、「検索語は含まれてなくてもユーザがクリックしたなら何か関係があるんだろう」と判断するのは、
          ユーザがその情報を収集されることに同意してるなら問題はないと思うんで、
          この件はGoogleの勇み足のように見えるなあ。

アレゲはアレゲ以上のなにものでもなさげ -- アレゲ研究家

処理中...