gooがブログを排除する検索オプションを追加 71
ストーリー by Acanthopanax
-without-blog 部門より
-without-blog 部門より
x-AC曰く、"RBB NAVIの記事によると、検索エンジンの「goo」が、自身のWebの全文検索サービスに、ブログを検索対象から排除する「ブログフィルター」を装備したとのことだ。Googleなどを通常使用していても、ブログが割と上位に表示されることが多いことはよく知られたことだが、それらをあらかじめ除外することで、より必要な情報にたどり着きやすくすることが目的らしい。
タレコミ人も検索エンジンを使用していて、結果に出てきたブログのリンクをクリックしてみたら、関連のニュースに対する2~3行のうなずきコメントだけだったりして、思いっきり脱力することがよくあるのだが、そういうことにうんざりしている向きにはちょうど良いのかも知れない。"
それより (スコア:4, すばらしい洞察)
Re:それより (スコア:1)
バイク関連なんか山ほど引っかかってorz
文字数が一定以下のエントリを排除するとか。 (スコア:3, すばらしい洞察)
「こんなことがあって、こうやって解決したぜ」
的なことを書いているブログが結構多くていつも役立たせていただいているため、単純なフィルタだとそういうのが見つからなくて困ります。
例えば「OpenLaszlo」とか、最近のキーワードで検索したとき、 みたいなのは排除して、 みたいなのは排除しないで欲しいと思うと、さてどうしたもんか。
文字数が一定以下のエントリを排除するとか?
Re:文字数が一定以下のエントリを排除するとか。 (スコア:1)
複数の記事がまとめて表示されてたら、それ全部が検索対象になってることですかね。
「○○ AND △△」という複数キーワード検索したときに、
ある日の記事に「○○」があり、それとは別の日の記事にまったく別のネタとして「△△」が使われていて、
その両方の記事を表示するページが検索に引っかかってくる。
さらには、そのページは「最新一週間の記事表示」とかしてるものだったりして、
実際に飛んでみると全然別の内容が表示されたりとか…
個別記事のみ検索対象にしてもいいので、
まとめて表示しているページだけは検索対象外になってくれれれば、
結構便利じゃないかと思うのですが…
Re:文字数が一定以下のエントリを排除するとか。 (スコア:1, 興味深い)
こういうの俺も昔はよくやってたんだけど、何でやってたかっていうとPageRankをあげるための応援で、かといってまだ試してないんで有用なコメントを思い浮かばなかったときでした。
普段は真面目にBlog更新してるんでPageRank自体は低くはなかったんで(特別高いサイトではなかったけど) リンクが応援になると考えてやってました。
ただし現在はやめました。なぜなら自分がそういうコメントをググって見つけたときイヤだから・・・。
Re:文字数が一定以下のエントリを排除するとか。 (スコア:1, 参考になる)
例えば、Tomcatという語を含む文書にはApacheとかF14とかの語が含まれることが多いけど、逆にApache含む文書にF14はめったに出てこないなどの傾向があるので、検索インデックスを作るときに「関係のありそうな単語ペアのデータベース」を作成しておきます。
んで、検索時にこのデータベースから、指定されていない隠れた検索語を補って、検索精度を高めようと頑張ります。
まあ、卒論なので「ふーんそれで?」以上のものにはなりませんでしたが、きっと世界のどこかではもっと頭のいい人がシンクロシニティーで似たようなもっとよい研究をしてるんじゃないかと期待してます。
これは敗北宣言だと思うのだが… (スコア:3, すばらしい洞察)
ま、どうせ goo なんて、翻訳しか使わないけど…
ただの二択オプション (スコア:1, 参考になる)
gooはblog以外を検索できますか? →Yes (今回追加のもの)
サービス全体を見ずして一部分のみを語るべからず、ですな。
適合率と再現率 (Re:これは敗北宣言だと思うのだが…) (スコア:1, 参考になる)
検索結果のうち、望ましい解をヒットした割合を「適合率」、
本来抽出する必要がある情報のうち実際に抽出できた割合を「再現率」といい、
基本的にはトレードオフの関係にあります。
確かに両方上げるのも腕なんですが、実用性という点から考えると
用途に応じたバランスをとることも重要なんです。
あなたが問題視したいのは、
「blogに含まれる情報が探せない」(= 再現率が犠牲になる)
ということだと思うのですが、
blogを外すのは適合率を上げるための戦略なので、再現率は下がっててあたりまえです。
適合率を上げる (= 望ましい解がスピーディに見つかる) ほうが
検索エンジンの一般的な使い方としては多そうですし。
ま、所詮はどっちを選ぶかの選択でしかないですよ。
正解の数が余りに少ない場合は適合率を犠牲にして再現率を上げる必要がありますし。
そういう意味では、オプションにして選べるようにしたのは正解でしょうね。
中味の読めない本の目次がひっかかる方が迷惑 (スコア:3, すばらしい洞察)
Re:中味の読めない本の目次がひっかかる方が迷惑 (スコア:1, すばらしい洞察)
情報を探してるんなら目次のヒットはいいことでは?
タダで手に入る情報にしか興味がないなら話は別だけど
Re:中味の読めない本の目次がひっかかる方が迷惑 (スコア:1)
あと、その本が絶版で手に入らない事も多いですし(特にM$関連の技術本)
既に終わってるセミナーのスケジュールとかも迷惑
Re:中味の読めない本の目次がひっかかる方が迷惑 (スコア:1, すばらしい洞察)
ブログ差別?w (スコア:2, 参考になる)
ブログに有益な情報が載ってた方が多い気がするな。
最近は、日記のように時間的な意味のあるサイト以外でも、
ブログのエンジンを使って情報を提供してるサイトが少なくないので、
そんなに意味があるとは思えません。
Re:ブログ差別?w (スコア:1, すばらしい洞察)
ただブログにも有益な情報は多々あるし、
かといって検索順位が情報の重みに比例してない実感はあるし、
今回のような ON/OFF ではなく、ブログを識別した上で
適正な評価を下せるアルゴリズムがより望ましいとは思う。
#自分に不要なものが万人に不要であるとは限らない。
#自分に必要なものも万人に必要であるとは限らない。
Re:ブログ差別?w (スコア:1, 興味深い)
本当のただの日記が増えたので、ノイズ除去と言う意味では
害より益のほうが大きいかなと思います。
それと他の方も言われてますが本当の目的はSEO対策を施した
アフィリエイト目当てのサイト除去でしょう。
残念ながらその手のサイトは一番手軽なblogの形式が多いので。
そういうところに押されて有益なサイトが検索で後ろに来る
のを防ぐ意味でプラス側の効果は少なくないと思います。
実際そういうサイトに役立つところはあんまりないですし。
真の目的のためにはあと一歩踏み込んだ対策は必要ですけど
まず第一歩として私は評価の方が大きいです。
Re:ブログ差別?w (スコア:1)
ただ、利用しているプロバイダがブログサービスをはじめた時に、
というメールを送ってきたのには、違和感がもりもり盛り上がったのも事実。
#ついでに書いた一行で、自分のブログが上位にヒットしているのを見た時に申しわけないのも事実。
ブログが有用?w (スコア:0)
間違いやどうでもいいような個人の意見表明にうんざりする事が多い気がするな。
最近は、日記形式でスタッフの防備録みたいなものをつけてるサイト以外でも、
ブログのエンジンを使ってきちんと整理されていない情報を提供してるサイトが多いので
非常に意味があることだと思います。
Re:ブログが有用?w (スコア:1, おもしろおかしい)
自分以外にも「ぼうびろく」と誤読・誤記してしまう人がいることがわかって有益でした。
(検索したら結構かかってきますが、そこまでしたことがなかった)
ブログが検索にかかってくるとこんなふうに本来の目的から逸れた
どうでもいいような情報を拾えることがありますね。
ブログのエンジンを使ってきちんと情報発信しているサイトも増えましたが
やはり良くも悪くも適当にやってる人が目立つので
逆にカジュアルな日本語のサンプルとしては面白いかもしれない。
mixiにも言えることだけど、HTMLなど意識したこともない人たちの発言が
リアル世の中なみの割合になってきたってことかな。
スラドに来るような人には無意味・不快なことも多いでしょうけど…。
というわけで、棲み分けのための技術はやっぱり必要な気がします。
大丈夫、貴方だけではないから (スコア:1)
で、ブログが沢山ひっかかりましたよ、と。
Youthの半分はバファリンでできています。
Re:大丈夫、貴方だけではないから (スコア:1)
gooでブログを除外して検索すると 736件 [goo.ne.jp]なので#988315さんにとっては無いほうが安心できるオプションですね。
どちらでもトップに表示される誤字等の館(ごじらのやかた) [rim.or.jp]で詳細な解説と考察がしてあって面白かったです。
Youthの半分はバファリンでできています。
完全なオフトピ (スコア:0)
備防録
Re:完全なオフトピ (スコア:1)
備忘録
#IDでいいや
Re:完全なオフトピ (スコア:1)
なんの防備かはわかりませんが。
Re:ブログ差別?w (スコア:1)
#もっとも、「ビアガーデン [google.co.jp]」の方がヒット件数は多いようですが。
-+- 想像力を超え「創造力」をも凌駕する、それが『妄想力』!! -+-
gooでの検索なんかしないので… (スコア:2, 興味深い)
特にタレ込みにあるような「リンクをクリックしてがっかり」なんてハナシは、調べ方が悪いか、リンク先がblogだと見分けることができていないか、という程度のことではないかと。
そういうのを脳内峻別できない人たちに向けて、特にgooを検索サイトとして利用しているような人たちに向けて、ということなら意味がありそうかもしれませんが、そういう層の人たちにblog除外機能とかって使いこなせるものであるのか… また、その手の人たちにとってはblogにより発信されている程度の情報もまた有用と感ずるのではないか、とか…
検索結果からblogを排除するオプションを用意するのではなく、普通に検索した検索結果の画面にてblogについてはソレとわかるようなマーキングをするほうが良いのかも?
#検索エンジンとしては期待しないけど、Firefoxの検索プラグイン [goo.ne.jp]は使わせてもらってます。
-+- 想像力を超え「創造力」をも凌駕する、それが『妄想力』!! -+-
Re:gooでの検索なんかしないので… (スコア:1)
リンク先のアドレスから、リンク先の状況を有る程度把握したりキャッシュを利用したりできるでしょうが
検索サイトの利用者としてはそのような人は少数派でしょう
できない多数の人にとっては今回のオプションは有用ではないでしょうか
下の方にも書かれていますが、他にもオークション・ショップ系や
2ch(これは祭りなりそうですが・・・)があると便利だと私は思います
Re:gooでの検索なんかしないので… (スコア:1)
揚げ足を取るような行為ですが、
gooはgoogleと同じエンジンですよ。
Re:gooでの検索なんかしないので… (スコア:1)
まー、どっちにしても、この場合は「検索サイト」という表記の方がより適切な表現でしたね。
ご指摘ありがとうございます。
-+- 想像力を超え「創造力」をも凌駕する、それが『妄想力』!! -+-
Re:gooでの検索なんかしないので… (スコア:0)
ブログかどうかの判別なんて機械的作業にわざわざ自分の脳味噌を
使わなくてすむようになったということでしょう。
私は諸手を挙げて歓迎します。
他の検索エンジンもぜひ対応して欲しいです。
別にブログに有用な情報がないとは思っていませんし、
ブログ検索も有効に利用させてもらっていますが、
やはりブログと普通のウェブページでは得られる情報の傾向は違うので、
手軽に区別できるならそれにこしたことはないです。
仰るようにマーキングでもいいんですが。
# ショップサイトのON/OFFオプションも欲しい
ブログフィルターっていうから (スコア:2, すばらしい洞察)
検索キーワードマッチングをやってくれるのかと思ったら。
if (blog) {shutout}
ですかそうですか。
余計なことせんでもええよ。
こうなったら手動で (スコア:2, 参考になる)
Re:こうなったら手動で (スコア:3, 参考になる)
検索オプションを既定で持たせたサーチプラグインを 作っておけます。
自分はいつも、まずコレで検索→欲しい情報が見つから
なかったら普通のGoogle で検索、という順番でやってます。
Re:こうなったら手動で (スコア:1)
そうでないサイトを識別できるのか (スコア:1)
ブログの内容 (スコア:1)
これじゃ検索の品質が上がるどころか下がりますね。
#だっていまどきインターネッツ上の情報の結構な割合をブログが占めてますからね。
##まぁその前に自分のブログがKids Gooにはねられてるわけだが。
###抗議メール送ったら表示されるようになっただけだが。
全文検索エンジンは容量と用法を正しく(以下略 (スコア:1)
#ちょうどハヤカワNFで「訴えてやる!大賞」(The True Stella Awardsの邦訳版)が出てる
全文検索サーチエンジンで検索するといっぱい引っかかるからみんな麻痺してしまってるんだと思う。
日記のページは全文検索にとって結構問題で、まったく違うテーマの文章がひとつのページにまとまってしまうことが多々として発生してしまう。
普通検索エンジンで精度を上げようとして「A and B」で検索かけるても目的のページよりも「n月m日:A、n月m+1日:B」ていううふうな日記blogが先に出てくることが結構あるんだこれが。
+=======------
| K.Hamaura a.k.a. SeyfertSluw
| 「SFはどこまで実現するか」 復刊希望は→http://www.fukkan.com/vote.php3?no=4901
便乗して愚痴 (スコア:1, 興味深い)
しかしだな、
ちょっとしたネタを書く日記なんかならともかく
固まっててこそ価値を持つ「仕様」を書いておくサイトに
静的なHTMLを用いないってどういう了見なんだろうと思うのよ。
なあfreedesktop.orgさん?
リンクに飛んだら新規編集ページに行った、
検索かけないと本来のページに辿り着けないって、
こういうサイトでは致命的だと思う。
ブログはゴミが多し (スコア:0)
検索エンジンにブログならではの評価方法を採用しないとノイズ率が高くて使えない感じです。
Re:ブログはゴミが多し (スコア:4, すばらしい洞察)
ブログが目立つようになる以前は,一通り苦労したりした点を という web ページが多かったと思う(そうでなければそもそも web ページにしようと思わない)のですが, ブログの場合は(日記的に書かれるものが多いせいか),背景・前提などの説明抜きに 結論だけ という私小説的というか,極めて断片的で外部の 参考になりにくいものが多い印象です.
さらに,リンクは網の目のように張られるためか,検索エンジンで上位に来てしまう のも,ブログ以外と比べて内容の密度に比例しない評価が検索エンジンにより 与えられてしまっている印象があります.
ちょっとしたことでも書き残して他の人の参考になるチャンスを残すという意味では ブログが悪だとまでは思いませんが,現時点では "検索対象からは外したい or スコアを下げたい", と思うことの方が多いです.
Re:ブログはゴミが多し (スコア:0)
blogなら途中経過やメモでも書きやすいという意味で有用じゃないかな。成功した結果のまとめよりも、試行錯誤してる途中経過の方が技術的に興味深かったりするし。
Re:ブログはゴミが多し (スコア:1)
>blogなら途中経過やメモでも書きやすいという意味で有用じゃないかな。
>成功した結果のまとめよりも、試行錯誤してる途中経過の方が技術的に興味深かったりするし。
で、結論が無いのが沢山引っかかったりするんだ、これが。
趣味でテキトーに見て回っているいる時なら兎も角、仕事で有用な情報を探している時にはヘコんでしまう。
Re:ブログはゴミが多し (スコア:2, すばらしい洞察)
blogに大量に書かれてる情報なら、一次情報にきちんとしたものが書かれてるだろうし。
#本当にへこむのは、ぐぐっても数十件しかヒットしないような事項を調査しないといけないとき
Re:ブログはゴミが多し (スコア:1)
また、サポートに何時でも電話が繋がるかっていうとさもあらず。
サポートに電話しながらググっていて、繋がる前に対処法を見つけた人も、スラドならそれなりに居るんではないかと。
Re:ブログはゴミが多し (スコア:0)
確かにありますね
同様の理屈でWikipediaの表示順位も下げて欲しいと思うのでAC
Re:ブログはゴミが多し (スコア:0)
単にブログにフィルタ掛けるって、gooも何も分かっちゃいないなと思う
Re:ブログはゴミが多し (スコア:1, 興味深い)
Re:ブログはゴミが多し (スコア:1)
#でもはてなのキーワードが3番目なんだよなぁ
Youthの半分はバファリンでできています。
そのゴミの山を探す時もある。 (スコア:0)
http://ask.jp/
最近調べたのはバイデザインのTVとソニーの学習リモコンの相性w
ブログ検索 (スコア:0)
他の人が言ってるように、検索した結果がブログの一言コメントだったり、さらにその記事が過去ログに流されて全然違う話題が記載されてると脱力してしまうので、ブログフィルタは有用でしょう。