パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

データをすべてファイル名扱いにして高速検索を実現?」記事へのコメント

  • by Anonymous Coward on 2008年01月21日 14時40分 (#1283938)
    http://japan.zdnet.com/release/story/0,3800075480,00023955p,00.htm [zdnet.com]
    http://release.nikkei.co.jp/detail.cfm?relID=174923&lindID=1 [nikkei.co.jp]

    推薦コメントにあげられた、コクヨ・日立は涙目?

    というか、RDBで100万件1秒ができないって。。。
    よっぽど検索条件悪いか、インデックスはり忘れか、
    作業メモリ容量の設定ミスでは?

    すくなくともPostgreSQLでそれぐらいの規模余裕だった記憶が。
    まぁ、テキスト完全一致と整数一致の組み合わせでしかやってないけど<100万
    • コメント元の推薦文として,日立の方の

      “ISSEI”はWeb2.0的システム構成において、ビジネスインテリジェンスを構成する重要なキーコンポーネントになると期待しています。多様な情報をセンサネットワークなどを使い、リアルタイムで集計・評価するビジネスアプリケーションの構築に重要な役割を持つはずです。このようなことから、新世代のソリューションコンポーネントとして活用を検討しています。

      っていうコメントがありますが,Web2.0のどこに関係するのかとか,センサネットワークだったら取れる情報はほぼ定型なんだからそれこそRDBでいいんじゃないのかなとか,半定型だったとしてもXML DBを組み合わせた方がデータの利活用がしやすいんじゃないのかなとか反論したくなります.とはいえ実際にセンサネットワークに携わったことがないのでなにかISSEIだとぴったりなことがあるのかもしれませんが.
      --
      屍体メモ [windy.cx]
      親コメント
    • by Anonymous Coward
      記事にはRDBSでは出来ない、と書いてないように思いますが。
      「膨大なコストと手間がかかる」(市販のRDB製品で構築するとなると数千万円かかる)のを改善(自社製品だと1/10の価格で出せますよ、と)しただけじゃないですか?
      ただ、手間について改善できたかどうかを書いていないのがちょっとあやしげだけど。
      • Re:他の記事 (スコア:4, すばらしい洞察)

        by okky (2487) on 2008年01月21日 16時47分 (#1284004) ホームページ 日記

        「膨大なコストと手間がかかる」(市販のRDB製品で構築するとなると数千万円かかる)のを改善(自社製品だと1/10の価格で出せますよ、と)しただけじゃないですか?


        えー、本当かなぁ。

        PostgreSQLでも MySQLでもインストールして、index まじめに張るだけジャン??
        # そりゃ Oracle 入れればそういう金額になるけどさ。

        ベースのソフトは無料だし、たかが数M entry に対して数百万かけてチューンして良いなら、これぐらいの性能は普通に出ると思うんだが…。
        --
        fjの教祖様
        親コメント
        • Re:他の記事 (スコア:1, 興味深い)

          by Anonymous Coward on 2008年01月21日 17時14分 (#1284031)
          それをいうなら「ISSEI(w」だって、
          PostgreSQLも MySQLも Oracle も入れる必要はなく、
          ただ Windows 入れるだけジャン。ここまでは間違いとは言えない。
          ある意味、無駄に高機能な Windows なんてソフトと、
          そんなクソOS をもサクサク動かせる超高性能ハードウェアを遊ばせない有意義な使い方ともいえる。

          問題は「OSメーカーと共同開発」とか「専用チップをメーカーと開発」なんて語ってるのが痛々しいところ。
          そんな欲張りというか勘違いせずに、「ISSEI(w」で片付くようなニッチな用途にフォーカスするなら、
          案外悪くないソリューションたり得る可能性も無くはないだろう。
          世の中で必要とされる案件の大半は、「ISSEI(w」で片付くようなつまらん仕事でしかないよ、実際。
          親コメント
      • by Anonymous Coward
        > 市販のRDB製品で構築するとなると数千万円かかる
        のが本当かなぁと思いますけどね。
        別に取りたい仕事じゃなかったから要件(100万件単位のデータ)をざっと見て適当に数千万とか言っておいたんじゃないのかと。
        • by Anonymous Coward
          この顧客は、
          「検索キーを何にするか?なにそれ???
          入ってる全データから検索したいの!
          yahooとか、googleとかみたいにできるでしょ。」
          など、言ったのでわ。
          # 実際に言われた経験あり…丁重にお断りしました。

          「RDBの限界」とか言わなけりゃいいのにねぇ。ただ「DBの限界」とか言っている方が
          抽象的表現でごまかせたのにw
          RDBは、Rerational構造あってのDB。ただ1:nのindex張りたいだけならRDBいらんと思う。
          (DB使えば、運用面でラクになる一面は持っているのも事実だけどね)

          比較対象はRDBじゃなくて、インデクシングの方法じゃないっすか?
    • by Anonymous Coward
      プレスを見ると、インデックスをいちいち張るのが面倒、あいまいや関連検索を行いたいという要望に答えたようなので、そもそも定型データではない気がします。一種のナレッジマネジメントとかの情報活用システムだと思います。

      類語や関連する情報で同じハッシュ値を持つようにして、それをファイル名に反映させたというところでしょう。
      gooがgoogleの検索に行っているあいまい検索のチューニングや、ブログ記事の関連検索と同じで、売りは類語や関連検索であり、Windowsのファイルシステムを使ったRDBを超えた検索は検討違いなうたい文句ですね。

Stableって古いって意味だっけ? -- Debian初級

処理中...