ユーザー参加型検索エンジン『netPlant』 32
ストーリー by yourCat
塵を積もらせて山にしよう 部門より
塵を積もらせて山にしよう 部門より
2006年度未踏ユース採用のユーザー参加型検索エンジン『netPlant』が2月5日よりベータ版のサービス提供を始めた。Firefoxのアドオン『Swimmie』を使って共有されたブックマークをベースにした検索サービスだ。以下に、仕組みを簡単に説明する。
- SwimmieでFirefoxのブックマークを公開
- Swimmieで同じ名前のブックマーク・フォルダを共有
- 公開されたブックマーク・データベースをnetPlantで検索
未踏ユース応募資料にある「検索結果もまた、ユーザがブックマークとして利用することができる」というフィードバック部分はまだ不明。悪意ある利用法への対処など、これから課題も多く出てくるだろう。しかしうまく行けば面白いサービスに育ちそうだ。
製作者の私が来ましたよ :-) (スコア:3, 興味深い)
Re:製作者の私が来ましたよ :-) (スコア:2, 興味深い)
Swimmieがファイルシステムとして見えるようになります。
カテゴリがディレクトリ、ブックマーク項目が.urlファイルとして見えます。
起動時にloginしてloadBookmarksして、フォルダを最初に開くときにinspectCategoryNodeして、update.buttonというファイルをtouchするとloadUpdatesします。
saveBookmarksDiffとか、定期的なloadUpdatesとか、PHPのセッションが切れたときの再接続は実装していません。
Re:製作者の私が来ましたよ :-) (スコア:1)
Ruby って使った事ないんでイメージ湧かないんですけど、SwimmieFC は Linux 専用ですか?
Re:製作者の私が来ましたよ :-) (スコア:1)
Ruby用のFUSEバインディングがFuseFSで、ユーザーがディレクトリやファイルにアクセスするごとに登録したオブジェクトのメソッドが呼ばれ、その返り値がディレクトリやファイルの中身として見えるようになっています。
スクリーンショット [aya.or.jp]
ファイルの中身は、例えばこんな感じになっていて、対応したブラウザでこのファイルを開くとこのURLが開かれます。
[InternetShortcut]
URL=http://netplant.jp/swimmie/
Re:製作者の私が来ましたよ :-) (スコア:1)
こういう仮想的な匂いのする物は大好きです。サイトの方で紹介しても構いませんか ?
Re:製作者の私が来ましたよ :-) (スコア:1)
どうぞ。ありがとうございます。
バグを取ったり機能を追加する場合もありますのでZIPファイルへ直接リンクを張ってください。
#とりあえずセッションが切れていたら再接続するようにしました。
Re:製作者の私が来ましたよ :-) (スコア:1)
FUSE (Re:製作者の私が来ましたよ :-)) (スコア:1)
Mac OS Xにも移植されています。
Re:製作者の私が来ましたよ :-) (スコア:0)
これってWindowsのURLファイルの書式(?)ですよね。
WindowsのExplorer(ファイルマネージャとしての)上だと
IEでもFirefoxでもデフォルトで動いてくれますよね。
Linux(KDE)だと動いてくれなかったので少々残念でした。
まあ、ブラウザを起動するほうは、簡単なスクリプトを書けば動くかとは思いますが、
逆にブラウザからURLファイルを作るほうはWin版FireFoxだと出来てるのに、
(アドレス欄左端のアイコンをファイルマネージャにDragDropすると出来る。
この振る舞い自体はWinではデフォだしKDEでも出来てる)
Linux版(?)だと単にURLを書いただけのテキストになってしまうようです。
これ、どうにかならないかな。
Dropしたときに作られるファイルの書式はカスタマイズ可能でしょうか? > 識者諸兄
ブックマークをする側のユーザのランキングが欲しい (スコア:2, 興味深い)
輩の排除だと思います。
その点、この検索エンジンは個人のブックマークからデータを流用しているため、
ブックマークをした人間の信用情報を利用してサイトの有用性を判定
するようにできるのではないでしょうか。
計算量が大変になりそうだという問題点をあえて無視していうと、
1.検索エンジンユーザがリンクをクリックすると、そのサイトをブックマーク
に入れていたブックマーク公開者にポイント加算
2.検索エンジンユーザが、リンクをクリック・閲覧した後に、「こいつはゴミサイトだ」
とみなして告げ口用ボタンを押すと、そのサイトをブックマークに入れていた
ブックマーク公開者のポイントを減算
1、2の操作でブックマーク公開者のポイントを決定し、各サイトのランキングは
そのサイトをブックマークに入れているブックマーク公開者のポイント合計に
よって決定します。
#こんな形式でスパムサイトを撲滅できないか、と昔考えていましたがどうでしょう。
Re:ブックマークをする側のユーザのランキングが欲しい (スコア:1)
Re:製作者の私が来ましたよ :-) (スコア:1, 興味深い)
いまいちエンジンの原理が分からないのですが、ブックマークにあるページを解析して順位付けしているということなんでしょうか?
Re:製作者の私が来ましたよ :-) (スコア:2, 参考になる)
Re:製作者の私が来ましたよ :-) (スコア:1, 興味深い)
Googleで「site:b.hatena.ne.jp」とかつけて検索するのとどう違うんですか?
Re:製作者の私が来ましたよ :-) (スコア:2, 参考になる)
Re:製作者の私が来ましたよ :-) (スコア:1)
製作者は、どの程度まで誰がどのブックマークをしているかの
情報を取っているのですか?IPぐらいですか?
Firefoxの拡張ってあんまり信頼できないし、ブックマークは
趣味が偏っている。
どのみちローカルな公開したくないものまでブックマークして
いるから公開できないけど。。。
Re:製作者の私が来ましたよ :-) (スコア:1)
・パスワード
・登録日時
・最終更新取得日時
・ブックマーク
以上です(ユーザ毎)。
パスタ (スコア:2, 参考になる)
課題は利用者の質の問題と不正利用しようとする輩への対処かなぁ
RはRevolution・Return・Rememberの意味です
Re:パスタ (スコア:2, おもしろおかしい)
18禁で検索したけど、まだ使い物になりませんでした。
どういう基準で使い物にならなかったか?だって……そんなの決まってるだろ
Re:パスタ (スコア:1)
充分に把握されていないようだ。
率先して使えるブックマークを公開し、サービスの質を向上させるのは
ユーザ自身の役割でもあるのですよ。
// まあ、アダルトサイトの検索だけの話じゃないからidでいいや
// p.s. 言っておくけど、私に期待しても、無駄だよ
趣味的分野では・・・ (スコア:2, すばらしい洞察)
微妙に違う趣味の人や、まったく別方向の人が増えるほど
結果がぼけていくのかな
結局はユーザーが増えれば増えるほど結果が薄まる気がする
#検索エンジンの自立って意味では面白いけど
これとは直接関係ないけど (スコア:1, 興味深い)
# 私が知らないだけかもしれないけど
クリックの重みづけ(下位ヒットでクリックされた方が重くなる)とか、釣りサイト対策とか、故意に特定のリンクをクリックしまくるspamの対策とか、運営面が難しいのかな。
Re:これとは直接関係ないけど (スコア:1)
確かにgoogleの検索結果の出力内容のソース見る限り、そうギミックはないが、Yahoo!JとgooはリンクのURLに仕込まれているような感じですけど。
でも、クリックの重み付けは、検索効率の改善の役には立つだろうから、実装されて欲しいような機がするな。
/* Kachou Utumi
I'm Not Rich... */
Re:これとは直接関係ないけど (スコア:2, 興味深い)
フィッシングサイトフィルタのすり抜けに利用されるという手口がニュースになったためか、数日前に戻りましたけど。
Re:これとは直接関係ないけど (スコア:0)
>釣りサイト対策
そっすね。
「みんながやらかし易いアクセス間違い」はランクが挙がってしまうわけだから、
URLの綴り間違いを狙ったソーシャルクラッキングの類を、元気付けてしまいそうだ。
下の方で、人をモデレーションするっていう案がでてるけど、
リンク自体もモデレーションが必要なのでは。
カテゴリ分けの重要性 (スコア:1)
まとめるための材料としてブックマークがどれだけ役に立つかは大いに疑問。
で、ふと思うんだが、書籍にはCコードというのがあって(ISBNの横のCに続く四桁の数字)
かなり細かくその本の属性(雑誌であるとかムックであるとか以上に人文系、理工系、ビジネス、教育などなど)
を明示できるわけなんだけど、これ、Webサイトにもつけたらどうかと。
んでHTMLのmetaタグなんかに書いておいたりBlogのエントリの横に隠しで入れておくと
クローラなりがそのサイトの性質を文字列としてでなく
データ化しやすいかたちで保存できるようになるわけだな。
Weblogなんかだと作成者がおもいつきでカテゴリ分けしてるのも多いだろうけど
それを標準化できれば抽出もゴミ抜きでできるわけで。
つーか、そういうの、もうあったりしないかね?
Re:カテゴリ分けの重要性 (スコア:2, すばらしい洞察)
> 理工系、ビジネス、教育などなど) を明示できるわけなんだけど、これ、
> Webサイトにもつけたらどうかと。
SEOスパムに悪用されることになれば、結局は metaタグの keywords
みたいな運命を辿ることになるのではないかと思います。
「カテゴリ分け」については、「fickr」や「はてなブックマーク」などで提供
されているタグ付け(フォークソノミー)の方が、サイト管理者の一方的な
カテゴライズよりも価値を持たせることができると思います。
集合知というやつですね。
Re:カテゴリ分けの重要性 (スコア:1)
Re:カテゴリ分けの重要性 (スコア:0)
それが今のところ,表層の文字列だけではうまくいかないんで,本文を書く側で解析のヒントになるような情報を(ある程度)つけてくれ,というのがセマンティック・ウェブ [wikipedia.org]なんじゃないかと思うのです……
塵を積もらせてもなぁ (スコア:0)
Re:塵を積もらせてもなぁ (スコア:0)
Re:塵を積もらせてもなぁ (スコア:0)
塵を手動で分別した例:dmoz [dmoz.org]→過疎化
塵を自動で掻き集めた例:ロボット型検索エンジン→ノイズだらけ