Bloglines.com、プライベートなRSSフィードを検索結果から外す仕様を提唱 33
ストーリー by kazekiri
普及するのだろうか 部門より
普及するのだろうか 部門より
Anonymous Coward曰く、"Bloglines.comは8月1日、不特定多数への公開を目的としていないフィードをサーチエンジンなどの検索結果から除外するように指定するための基準を公開しました(Bloglines.comのアナウンス)。RSS、Atomに新しい要素(<access:restriction>)を追加することで対応するサーバにアクセス制限を伝える仕様のようです(Bloglines.comが公表した仕様、日本語訳)。現時点ではこの基準を解釈するのはBloglines.comとAsk.comのみですが、サーチエンジンがこれを適切に解釈するようになれば、robots.txtのように広く普及するかもしれません。"
なぜ公開? (スコア:3, すばらしい洞察)
特定ユーザにだけ見せたいなら、特定ユーザの持つセッションに対応してRSSを返せばいいんだし。
Re:なぜ公開? (スコア:1)
ただし、中には見せる必要の無い人、見ても仕方の無い人がいるわけです。
そこを簡単に判別できるようにする仕様がコレだと思います。
全部見る/見ないっていう二択しか無いよりは、良い事だと思います。
Re:なぜ公開? (スコア:3, 参考になる)
タレコミ中にある仕様の日本語による解説 [ppmz.com]を見る限り、<access:restriction relationship="allow"/>か<access:restriction relationship="deny"/>のみで、「全部見る/見ないっていう二択」になってますね。しかもルート要素直下にこれだけ記述する (名前空間URIは除く) んで、誰かに見せて誰かには見せない、という話ではない。URIを直接知っている人には見せて、検索エンジン経由での来訪者を拒否するという仕様になっている模様。つい先日のgooがブログを排除する検索オプションを追加 [srad.jp]という話と併せると判り易いかも。自主的にこのフィードは検索する価値なしと宣言しているだけですよね。
もし見せたくない人に対して拒否したいと思ったとしても、この仕様では「晒し上げ」されると無力かと。
Re:なぜ公開? (スコア:0)
Re:なぜ公開? (スコア:0)
メタ的に情報を与えるより (スコア:2, すばらしい洞察)
・「つまらないページ」「役に立たない記録」等、情報価値が極めて低いことを明記してあるサイト。
・無断リンク禁止。
こういうのを内容から判定して検索結果から外してあげればいいのに。
無駄に謙遜しつつもやっぱり見てもらいたいという日本人の心情には合わないかもしれないけれど。
Re:メタ的に情報を与えるより (スコア:1)
要素を追加してもらうというのはごく自然な流れ。
Re:メタ的に情報を与えるより (スコア:0)
内容から勝手な判断「する/しない」
執筆者の勝手なフラグで判断「する/しない」
といったオプションを検索エンジンに用意して
検索かける人が使い分けるのが一番良いと思う。
Re:メタ的に情報を与えるより (スコア:0)
Re:メタ的に情報を与えるより (スコア:0)
とかおもったり。
Re:メタ的に情報を与えるより (スコア:0)
役に立つ情報ばかりを求めているわけではないですし。
「あいつは今ネットで何かしてるのかな?」みたいな検索とか。
Re:メタ的に情報を与えるより (スコア:0)
うにゅ、呼んだ?
# 役に立たない書き込みなのでAC
ついでに (スコア:2, 参考になる)
検索ワードを得意げに表示するページも何とかして
欲しい。
技術的な内容を検索して引っかかったページに、
「今日の晩飯」しか載ってないようなくだらない
ページがあると思ったら、過去に誰かがうっかり
踏んだと思われるキーワードの「一覧」にヒット
しただけという・・・。
#そういう検索中にそういうページを踏むほうも
#踏むほうだと思う。>最初に踏んだ人
Re:ついでに (スコア:0)
RSSでよく使われる語彙(の名前空間) (スコア:2, 興味深い)
ところで、未知の語彙にぶち当たったときってどう処理すればいいんでしょうね?いや、人間だとなんとでもなるんでしょうが、機械だとどうすればいいのかな。全部が全部 RDF ベースならとりあえずたくさん知識を持っていれば推論できるんでしょうが、そもそも RDF 的でない語彙がたくさんあるし。 GRDDL ? Semantic SDO ? とりあえずそれっぽく強引にトリプルにしてみる ? って言ってもその後どうすんべ?
屍体メモ [windy.cx]
認証の仕組みを考えてよ (スコア:1)
認証の仕組みを考えてもらったほうが安心なんだけど...
旅に出ます.(バグを)探さないで下さい.
Re:認証の仕組みを考えてよ (スコア:0)
robots.txt を使って十分というケースもありますから、「直接URL叩かれる分には仕方ないけど、検索結果に残らないくらいで十分」という需要は結構あるんですよ。
Re:認証の仕組みを考えてよ (スコア:0)
Re:認証の仕組みを考えてよ (スコア:1)
# URLにユーザ名とパスフレーズを含ませるのはない方向で
旅に出ます.(バグを)探さないで下さい.
逃げ道確保 (スコア:1, 興味深い)
> アクセスを「許可」するということは、
> フィードがサーチエンジンを含む他の公共ソースに
> 再配布される可能性がある事を意味します。
(中略)
>標準ではrelationshipはアクセスを許可します。
穿った見方をするとブログを書いた人がサーチエンジン会社に文句言ってきたときに 「アクセス拒否してない方が悪い」 というために用意したんじゃないかな。かな。
これって (スコア:0)
Re:これって (スコア:1)
Re:これって (スコア:0)
Re:これって (スコア:0)
ロボットが対応してるかどうかは別問題ですが。
Re:これって (スコア:0)
数万数十万のコンテンツを抱える場合など、スケールしないので無理。
例: http://blog.example.jp/user/
Re:これって (スコア:0)
robots.txtに追加してくれって頼んだら、引き受けてくれた所がありますよ。
本気で弄りたい人はサポートに頼むのもいいのでは?
# 無料スペースでユーザのサイトのアクセス数減ったら本末転倒な気もしますが・・・
お馬鹿な検索エンジン (スコア:0)
無視するでしょうね。きっと。
お馬鹿蜘蛛への恨み辛みを書くスレ (スコア:0)
最初はちょろちょろとしたアクセスだったので気にしてなかったのですが、
暫くすると馬鹿みたいな勢いで全ファイル嘗め回します。
Re:お馬鹿蜘蛛への恨み辛みを書くスレ (スコア:0)
誰の為のものか (スコア:0)
検索結果から除外できるようblog運営者の自己申告させるもので、
blog運営者の為に彼らのプライバシーを守る性格のものではないよね。
つまり、趣味:SEXッ!みたいな人向け? (スコア:0)