アカウント名:
パスワード:
> 「興味のあるURLを集めてコメントすることで構成され、更新頻度が高いサイト」
某2ちゃんねるはblogに含まれるのでしょうか? 「(スレッドを立てる人間が)興味のあるURLを集めて(面白半分で)コメント(=祭)することで構成され、更新頻度が(極端に)高いサイト」に該当するような気がします。
日本限定の文化ですが、是非とも2ちゃんねるのスレッドは通常の検索結果から外して別枠にして欲しいです。
別に「2ちゃんねるを検索結果から排除しろ」と言っているのではなく、「スレッド検索は別に表示してもらったほうが便利」と言ってるだけですのでご安心を。
そういう人もいるんですね。いや皮肉じゃなくて。
私もGoogleはよく使うんだけど、検索結果の上位に2chがでてくることはとても珍しいです。 2ch関連はかなり後ろにしか出てこないか、全く出てこない。 だから“ -site:2ch.net”とかつけてもつけなくても変わらないし、別枠にする必要もない…
どんなキーワードだと2chでたくさんひっかかるようになるんだろう?
個人的には、2chはGoogleの通常の検索結果には入っていてもかまわない・・・、というか、入ってもらっていたほうがいいかな。
自分自身あまり2chは好きではないですが、でも全く有用な情報がないわけでもないので、そういうのはGoogleのキャッシュ機能で見るの
現状google(及びそれに限らず検索エンジン全体)の抱える問題
本当かよ。問題になってるのは、別に検索エンジンが抱えこんでる訳じゃなくて、たいていの言語につきものの単語の多義性だろ?
進化すべき
本当かよ。問題になってるのは、別に検索エンジンが抱えこんでる訳じゃなくて、 たいていの言語につきものの単語の多義性だろ?
これを自然言語が抱える問題として諦めてしまうのではなく、 自然言語の特性をうまく処理できていない検索エンジンの力不足として 取り扱うことによって技術は進化できる。
こういう問題に直面したとき 「単語の多義性だから仕方ない。エンジンの問題ではない」と看做すか 「まだまだ改良の余地は残ってるぞ。 つまり現状のエンジンには改善すべき問題点が残っている」 と考えるか、2通りに人間を分けることができる
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
人生unstable -- あるハッカー
某ちゃんねるは (スコア:2, 興味深い)
> 「興味のあるURLを集めてコメントすることで構成され、更新頻度が高いサイト」
某2ちゃんねるはblogに含まれるのでしょうか?
「(スレッドを立てる人間が)興味のあるURLを集めて(面白半分で)コメント(=祭)することで構成され、更新頻度が(極端に)高いサイト」に該当するような気がします。
日本限定の文化ですが、是非とも2ちゃんねるのスレッドは通常の検索結果から外して別枠にして欲しいです。
別に「2ちゃんねるを検索結果から排除しろ」と言っているのではなく、「スレッド検索は別に表示してもらったほうが便利」と言ってるだけですのでご安心を。
Re:某ちゃんねるは (スコア:3, 参考になる)
# site:domain にもマイナスが使えるみたい
Re:某ちゃんねるは (スコア:1, 参考になる)
ただ検索結果が満足のいくものでなく、また確かボットを走らせるので丁度 2ch の帯域問題による閉鎖危機がまだみんなの記憶にある頃でそれほど歓迎されていなかった気も。
Re:某ちゃんねるは (スコア:0)
Re:某ちゃんねるは (スコア:0)
これを実施すると Googleの検索結果の質は下がるよね。そうまでしてあなたが別枠にしてほしいと思う理由はわからないけ
Re:某ちゃんねるは (スコア:1)
そういう人もいるんですね。いや皮肉じゃなくて。
私もGoogleはよく使うんだけど、検索結果の上位に2chがでてくることはとても珍しいです。
2ch関連はかなり後ろにしか出てこないか、全く出てこない。
だから“ -site:2ch.net”とかつけてもつけなくても変わらないし、別枠にする必要もない…
どんなキーワードだと2chでたくさんひっかかるようになるんだろう?
Re:某ちゃんねるは (スコア:1)
ウルトラカルトなキーワードだと、1件ヒットで、それが2chのスレッド
ということはときどきありますな。
IN EARTH AND SKIE AND SEA STRANGE THYNGES THER BE.
Re:某ちゃんねるは (スコア:1)
そういう場合に2chをサイト外し検索すると、漏れなく不幸になるわけですね(^^;
結局、web検索ってものは、絞込みは甘めにするのが吉っつーことで。
Re:某ちゃんねるは (スコア:1)
という情報が出ていれば問題ないわけですね。
今は日本語で検索して0件だと自動的に全言語検索に飛んでしまいますが。
カルトじゃなくて (スコア:1)
密着したものでも、ググって2chでたくさん引っかかることが
多いですよ。殊に、特定地域に特徴的な問題に関しては。
たとえばスポーツなら、チームや選手ごとの情報。料理なら
レシピや素材。
もっとも、急がなくてよい分野であれば、現状の Google でも
充分にいいでしょう。各スレッドが html 化されるまでの
タイムラグを容認できるならば。
Re:某ちゃんねるは (スコア:0)
その根拠は?
あそこは半端に日本語に似ているために、
通常の検索の妨げになってるんですが...。
2ちゃんねるというととたんにエモーショナルになる (スコア:1, 興味深い)
一応真面目に答えておくけど。
あそこもWeb上のほとんどの場所と同様、情報としては実に S/N比は低い。
だが、これも間違いないことだが、ゼロだというわけでもないんだ。常識的に考えてみろ。君はそうでないと言い切れる?
そして、そのガレキの中から、数少ない玉を探し出して仕事なり暮らしなりに生かしている奴もいるのさ。
君にそれは無理なのかもしれないが、だからといって他の奴みんながそうだとは思わないでくれ。
検索の妨げになってたら、検索結果をもっと絞り込めよ。せめてそれくらいは出来るよね?
Re:本気なんだけどなぁ (スコア:0)
# 馬鹿馬鹿しい。
ドメイン除外検索が欲しいというのは同意します。
あるよ (スコア:1)
検索ワードに「-site:2ch.net」を追加
Re:あるよ (スコア:0)
Re:あるよ (スコア:0)
「googleにドメイン除外検索がついていない」と考えていたところを改めるなら
それを前提にした
> はっきり 2ch が嫌いだから見たくないと言いましょう。
という憶測や
> # 馬鹿馬鹿しい。
という評価をそのままにしないでほしいところ
Re:本気なんだけどなぁ (スコア:0)
それに「○○は一見日本語だけど日本語ではないから」と外国人に言ったところで
「馬鹿抜かせ、Shift_JIS(/EUC_JP/ISO-2022-JP)で更新されてるじゃねえか」で一蹴されると思わないか?
Re:本気なんだけどなぁ (スコア:0)
Re:本気なんだけどなぁ (スコア:0)
Re:本気なんだけどなぁ (スコア:0, 荒らし)
#日本語のつもりなのでG7
#え?特定人格排除ですか?それって馬鹿馬鹿しいです(藁
Re:本気なんだけどなぁ (スコア:0)
個人的には、2chはGoogleの通常の検索結果には入っていてもかまわない・・・、というか、入ってもらっていたほうがいいかな。
自分自身あまり2chは好きではないですが、でも全く有用な情報がないわけでもないので、そういうのはGoogleのキャッシュ機能で見るの
ネオ日本語? (スコア:0)
恥ずかしいことだと思わなければいけませんよ。そんなあなたにはKidsGooが
オススメだ。日本語を勉強して2chが読めるようになったら、またおいで。
>あそこの「日本語らしきもの」がほとんど読めないんですよ。
Re:某ちゃんねるは (スコア:0)
似ているとは?あそこの内容は日本語に間違いないと思いますが。
>> これを実施すると Googleの検索結果の質は下がるよね。
>その根拠は?
#314959のACではないですが。
例えば
Re:某ちゃんねるは (スコア:0)
googleの提供しているものは出来る限り外的要因を排除したサーチエンジンだから、でしょう。
アレがノイズだと多くの人が訴えるようになればノイズと判断して排除してくれるかもしれないですね。
個人的にもgoogleには純粋な結果を提供して欲しいです。
Re:某ちゃんねるは (スコア:0)
極東の一国家内の一掲示板サイト程度でそんな事すると思う方が愚か。
「-site:hoge.fugaしてください」で終わり。
そんな訴えがまかり通るなら同性愛関係
Re:某ちゃんねるは (スコア:0)
2ちゃんねるやblogとかで、全然別の文脈でそれぞれの言葉が出てきてるページが見つかったりして困ります。
そういう点では、2ちゃんねるとか用には別の検索システムが欲しいところです…
Re:某ちゃんねるは (スコア:1)
んが,2chではアンカーがついていない罠…
そういう (--html-split) ことが一般的になったら2chサイドも考慮してくれるんじゃないだろうか。
# 楽観的すぎるかなあ
Re:某ちゃんねるは (スコア:1, 興味深い)
--html-split の存在は非常に有効だと思います。
しかし多くの掲示板の各記事は
関連した1まとまりのドキュメントの中の章立てではなく、
1つ1つがそれぞれ独立した記事ですので、
通常 --html-split がターゲットとしているものとは異質であり
相性が悪いと思います。
この場合は、複数の記事が羅列されたページに --html-split をかける方式ではなく、
それぞれ個々の記事だけを表示するページも用意し
(2chの場合はURL末尾が スレッド番号+"/"+記事番号 となるようなもの)
それに対してのリンクのリストページも用意することで
googleに対して --html-split と同様な結果を作らせる方がスマートです。
Re:某ちゃんねるは (スコア:0)
と言うか検索エンジン側で何とか出来ないかな、みたいな。
2ちゃんねるのを的確に検索できる検索エンジンって、かなり人気が出そうに思いますけどね…。
2chに限らず、tcup.com
Re:某ちゃんねるは (スコア:0)
とりあえず (スコア:0)
とりあえず-2chすれば良いのにって感じだよね。
Re:某ちゃんねるは (スコア:0)
Re:某ちゃんねるは (スコア:1)
「アポロ 月」
月の天体特性などについて知りたいなら
「質量 公転周期 月」
のようにヒットしそうな単語をくっつければいいですよ
Re:某ちゃんねるは (スコア:0)
Re:某ちゃんねるは (スコア:0)
悉く「月」(暦のMonth)に関しての結果しか出ない
というのは現状google(及びそれに限らず検索エンジン全体)の抱える問題
や進化すべきポイントを具体的に表現する1例に過ぎないわけで…
そういう個々の単語に纏わる問題ではなく
「検索エンジンと日本語」の組み合わせで出てくる問題
Re:某ちゃんねるは (スコア:0)
本当かよ。問題になってるのは、別に検索エンジンが抱えこんでる訳じゃなくて、たいていの言語につきものの単語の多義性だろ?
Re:某ちゃんねるは (スコア:0)
これを自然言語が抱える問題として諦めてしまうのではなく、 自然言語の特性をうまく処理できていない検索エンジンの力不足として 取り扱うことによって技術は進化できる。
こういう問題に直面したとき 「単語の多義性だから仕方ない。エンジンの問題ではない」と看做すか 「まだまだ改良の余地は残ってるぞ。 つまり現状のエンジンには改善すべき問題点が残っている」 と考えるか、2通りに人間を分けることができる
Re:某ちゃんねるは (スコア:1)
A:「つき」について、知りたいなぁ。
B:睦月如月……
A:そっちじゃなくて、空のほう。
B:ああ。公転周期が……
これって絞り込み検索じゃありません?
馬鹿な検索エンジン (スコア:0)
AとB両者に共通の知識があるという前提。
googleの絞り込み検索とは質が違う。
googleの場合、ネット上リソース収集時に
単語分かち書き程度のparseは行うが、
そのとき発見された「月」という単語が
暦を現すのか天体を現すのかをその周辺の言葉から
探り出すという処理を行っていないため、
いずれであっても同一の「月」という言葉だけで登録してしまう。
そのためAとB
Re:馬鹿な検索エンジン (スコア:0)
> よってAとBの会話のような絞り込みは現在のgoogleには不可能。 全然「よって」になっていませんけど?
A:「つき」について、知りたいなぁ。( 「月」で検索 [google.co.jp])
B:睦月如月……
A:そっちじゃなくて、アポロが行ったほう。( 「アポロ」を追加 [google.co.jp])
B:ああ。公転周期が……
こうすれば絞り込みできますよね。
ここでのポイントはAが「天体の月」であることを説明する手段を持っ
ているかどうかで、これはgoogle検索でも自然言語でも変わりません。
たしかにgoogleは
>「月という単語には暦としての意味もあれば天体としての意味
Re:馬鹿な検索エンジン (スコア:0)
> だけの話ではないですか?
それは検索エンジンが変わらないことを前提にした上で
利用者に徹した考えでは?
将来の検索エンジンがどのように変わってほしいかという話題に
それを持ち出すのはよろしくない。
Re:馬鹿な検索エンジン (スコア:0)
> B:睦月如月……
> A:そっちじゃなくて、アポロが行ったほう。(「アポロ」を追加 [google.co.jp])
> B:ああ。公転周期が……
2回目のAの発言(3行目)はもともと「そっちじゃなくて、空のほう」と書かれていました。
それに対して「googleにAI的知識がないためgoogleにBの代役が務まらない」
という指摘がでているのに、それへの反論を出すとき
「空のほ
Re:某ちゃんねるは (スコア:0)
Re:某ちゃんねるは (スコア:0)
Re:某ちゃんねるは (スコア:0)
dat落ちになりそうなのをミラーリングするのを、
そこそこ活発なスレッドでもあまり見かけないのは、
2ch的にマナー違反なんでしょうか。
なんか皆が自主規制してるみたいな?
というかdat落ち>HTML化期間がなんであんなに長いんだろう…
それでいて>>1とかがページ内アンカーへのリンクになる訳でもないし。
Re:某ちゃんねるは (スコア:1)
>そこそこ活発なスレッドでもあまり見かけないのは、
このあいだここの別のところでも書いたんだけど、
あるスレに頼めばだいたい1日のタイムラグでミラーリングしてくれるし、
20000レス(20スレ)ほどもたまっていて、かつ良質なスレだと、
そのうちサイトにする人が現れますね。
あそこの人間(ほんとはあそこの人間に限らないのだろうが)は、基本的に面倒くさがりで、
他の人がやってくれるの待ってる人が非常に多いから、
たったそれだけの事でも神扱いされるわけで。
Re:某ちゃんねるは (スコア:0)
賑やかな所だがビデオ撮影するものじゃ無いな、みたいな。
# 何もかも保全するほど暇じゃないんでしょ、多分
と思ってDAT落ちしてみたら案外価値があったんで、しょうがないからway back machineやgoogle cacheから復旧すると。
Re:某ちゃんねるは (スコア:0)
> User-Agent: *
Re:某ちゃんねるは (スコア:1)
Re:某ちゃんねるは (スコア:0)