パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

ノイズの少ない検索エンジン」記事へのコメント

  • by Anonymous Coward
    もろ、お世話になっている業界のものですが、2年くらい前から「仕事の」検索ではGoogle+Scirusがデフォルトです。

    ただ、会社が全文閲覧の契約をあまりしていないと、結局米国立バイオテクノロジー情報センター(NCBI [nih.gov])のPubMed [nih.gov]と変わりないでので、もっぱらJournal

    • 検索エンジンは、ロボットを使ってサイトを巡回してページを読み、だいたい現れる語の頻度から重要な単語(索引語)を選んでDBに保存します。Journalのサイトはどこにあるか分かっているので、ひたすら索引語を抽出するだけですが、AIPのサイトは、目次やabstractにも著作権があるから勝手に読むなと言ってやらせてくれません。エルセビアなんかは、ビジネスのためにはそっちの方が良いと思って、とにかく情報を出すので上位にランクされることになる。

      索引語とユーザーの入力した単語の一致でアタリを判断しますが、普通ユーザーは1つか2つの単語

      • なるほど

        生物系の場合AbstructはMEDLINE(Pubmed)としてオープンになってるし(すいません、生物学系に話持っていって)、本文も他出版社の分も含めてScienceDirectとして自前で持ってる訳で、自分のところの雑誌を優遇していたらやだな、と思ったんです。利益が絡む企業がやってるんで当然といえば当然だし、一部の雑誌だけでも全文検索できるのはありがたいのですけども。

        検索結果の表示の画面で興味を持った論文とかウェブサイトにチェックを入れて保存していくと(実際Scirusの検索結果にはそれがあるのだけど)、保存されたレコードを元に新しい検索結果に重み付けをしてくれるような仕組みはあったらいいかなと。実際、索引語がどれくらいオーバーラップしてるかで類似レコードを引っ張ってくる仕組みはSirusに搭載されてるみたいだし(similar resultsなんてのがある)、技術的には難しくないんじゃないかと思ったりします。その辺については素人ですが。

        一見さんには適用できないので意味はないかもしれないけど、研究者が使うことが多いと思うので、興味にあわせたランク付けってのはあるとうれしいですね。

        #結局、時間かけて検索語をうまく工夫して絞り込めばいいだけなんですけど、
        #もうちょっと楽できないかな、とも思う訳で。
        親コメント

犯人はmoriwaka -- Anonymous Coward

処理中...