アカウント名:
パスワード:
> 「興味のあるURLを集めてコメントすることで構成され、更新頻度が高いサイト」
某2ちゃんねるはblogに含まれるのでしょうか? 「(スレッドを立てる人間が)興味のあるURLを集めて(面白半分で)コメント(=祭)することで構成され、更新頻度が(極端に)高いサイト」に該当するような気がします。
日本限定
現状google(及びそれに限らず検索エンジン全体)の抱える問題
本当かよ。問題になってるのは、別に検索エンジンが抱えこんでる訳じゃなくて、たいていの言語につきものの単語の多義性だろ?
進化すべき
本当かよ。問題になってるのは、別に検索エンジンが抱えこんでる訳じゃなくて、 たいていの言語につきものの単語の多義性だろ?
これを自然言語が抱える問題として諦めてしまうのではなく、 自然言語の特性をうまく処理できていない検索エンジンの力不足として 取り扱うことによって技術は進化できる。
こういう問題に直面したとき 「単語の多義性だから仕方ない。エンジンの問題ではない」と看做すか 「まだまだ改良の余地は残ってるぞ。 つまり現状のエンジンには改善すべき問題点が残っている」 と考えるか、2通りに人間を分けることができる
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
吾輩はリファレンスである。名前はまだ無い -- perlの中の人
某ちゃんねるは (スコア:2, 興味深い)
> 「興味のあるURLを集めてコメントすることで構成され、更新頻度が高いサイト」
某2ちゃんねるはblogに含まれるのでしょうか?
「(スレッドを立てる人間が)興味のあるURLを集めて(面白半分で)コメント(=祭)することで構成され、更新頻度が(極端に)高いサイト」に該当するような気がします。
日本限定
Re:某ちゃんねるは (スコア:0)
2ちゃんねるやblogとかで、全然別の文脈でそれぞれの言葉が出てきてるページが見つかったりして困ります。
そういう点では、2ちゃんねるとか用には別の検索システムが欲しいところです…
Re:某ちゃんねるは (スコア:1)
んが,2chではアンカーがついていない罠…
そういう (--html-split) ことが一般的になったら2chサイドも考慮してくれるんじゃないだろうか。
# 楽観的すぎるかなあ
Re:某ちゃんねるは (スコア:1, 興味深い)
--html-split の存在は非常に有効だと思います。
しかし多くの掲示板の各記事は
関連した1まとまりのドキュメントの中の章立てではなく、
1つ1つがそれぞれ独立した記事ですので、
通常 --html-split がターゲットとしているものとは異質であり
相性が悪いと思います。
この場合は、複数の記事が羅列されたページに --html-split をかける方式ではなく、
それぞれ個々の記事だけを表示するページも用意し
(2chの場合はURL末尾が スレッド番号+"/"+記事番号 となるようなもの)
それに対してのリンクのリストページも用意することで
googleに対して --html-split と同様な結果を作らせる方がスマートです。
Re:某ちゃんねるは (スコア:0)
と言うか検索エンジン側で何とか出来ないかな、みたいな。
2ちゃんねるのを的確に検索できる検索エンジンって、かなり人気が出そうに思いますけどね…。
2chに限らず、tcup.com
Re:某ちゃんねるは (スコア:0)
とりあえず (スコア:0)
とりあえず-2chすれば良いのにって感じだよね。
Re:某ちゃんねるは (スコア:0)
Re:某ちゃんねるは (スコア:1)
「アポロ 月」
月の天体特性などについて知りたいなら
「質量 公転周期 月」
のようにヒットしそうな単語をくっつければいいですよ
Re:某ちゃんねるは (スコア:0)
Re:某ちゃんねるは (スコア:0)
悉く「月」(暦のMonth)に関しての結果しか出ない
というのは現状google(及びそれに限らず検索エンジン全体)の抱える問題
や進化すべきポイントを具体的に表現する1例に過ぎないわけで…
そういう個々の単語に纏わる問題ではなく
「検索エンジンと日本語」の組み合わせで出てくる問題
Re:某ちゃんねるは (スコア:0)
本当かよ。問題になってるのは、別に検索エンジンが抱えこんでる訳じゃなくて、たいていの言語につきものの単語の多義性だろ?
Re:某ちゃんねるは (スコア:0)
これを自然言語が抱える問題として諦めてしまうのではなく、 自然言語の特性をうまく処理できていない検索エンジンの力不足として 取り扱うことによって技術は進化できる。
こういう問題に直面したとき 「単語の多義性だから仕方ない。エンジンの問題ではない」と看做すか 「まだまだ改良の余地は残ってるぞ。 つまり現状のエンジンには改善すべき問題点が残っている」 と考えるか、2通りに人間を分けることができる
Re:某ちゃんねるは (スコア:1)
A:「つき」について、知りたいなぁ。
B:睦月如月……
A:そっちじゃなくて、空のほう。
B:ああ。公転周期が……
これって絞り込み検索じゃありません?
馬鹿な検索エンジン (スコア:0)
AとB両者に共通の知識があるという前提。
googleの絞り込み検索とは質が違う。
googleの場合、ネット上リソース収集時に
単語分かち書き程度のparseは行うが、
そのとき発見された「月」という単語が
暦を現すのか天体を現すのかをその周辺の言葉から
探り出すという処理を行っていないため、
いずれであっても同一の「月」という言葉だけで登録してしまう。
そのためAとB
Re:馬鹿な検索エンジン (スコア:0)
> よってAとBの会話のような絞り込みは現在のgoogleには不可能。 全然「よって」になっていませんけど?
A:「つき」について、知りたいなぁ。( 「月」で検索 [google.co.jp])
B:睦月如月……
A:そっちじゃなくて、アポロが行ったほう。( 「アポロ」を追加 [google.co.jp])
B:ああ。公転周期が……
こうすれば絞り込みできますよね。
ここでのポイントはAが「天体の月」であることを説明する手段を持っ
ているかどうかで、これはgoogle検索でも自然言語でも変わりません。
たしかにgoogleは
>「月という単語には暦としての意味もあれば天体としての意味
Re:馬鹿な検索エンジン (スコア:0)
> だけの話ではないですか?
それは検索エンジンが変わらないことを前提にした上で
利用者に徹した考えでは?
将来の検索エンジンがどのように変わってほしいかという話題に
それを持ち出すのはよろしくない。
Re:馬鹿な検索エンジン (スコア:0)
> B:睦月如月……
> A:そっちじゃなくて、アポロが行ったほう。(「アポロ」を追加 [google.co.jp])
> B:ああ。公転周期が……
2回目のAの発言(3行目)はもともと「そっちじゃなくて、空のほう」と書かれていました。
それに対して「googleにAI的知識がないためgoogleにBの代役が務まらない」
という指摘がでているのに、それへの反論を出すとき
「空のほ