パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

バイオインフォマティクスプログラミングコンテスト BIP2004開催」記事へのコメント

  • 先月日記に書いた [srad.jp]ときにはこの話が出てきたら少し毒でも吐こうかと思っていましたが、
    トピックとは関係ない部分でも悪態をつく人が多いようなので辟易して止めます。

    このコンテストの審査員が文科省関連の方が多いのは主催(というか予算の流れ)
    からみても当たり前で、表彰式の行われる会場では文科省の方がスピーチをしたり
    するわけです。

    IT関連の人材発掘のために行われているように勘違いされている方も多いようです
    が、実際のところはこのコンテストの課題は現実に生物学における大量のデータ処
    理を行うに当たって必要な技術が求められており、これから生物学を志す学生や若
    手の研究者を対象としていると考えています。
    前回の受賞者も研究者が殆どを占めていますし、受賞した報告のうち内容が優れて
    いれば学術雑誌にも掲載されうるでしょう。

    では門外漢には何の意味もないかといえばそういうわけではなく、ちょっとしたア
    イデアがあれば数日かけてレポートを提出するとバイト代としてはなかなかの商品
    がもらえたり会議に招待されて旅行したりできるといううまみがあるというところ
    です。
    しかも、他のコンテストに比べたら競争率も低く義務も少ないので投資効率はかな
    りいいという話(笑)
    --
    kaho
    • by y_tambe (8218) on 2004年02月14日 21時36分 (#495837) ホームページ 日記
      ここにぶらさげます。

      ウェットな実験をやっている立場からすると、正直、いわゆる「システムバイオロジー」の恩恵にこそあんまり期待してなかったりします。どっちかというと元データを捻出する側ですから。
      #ある意味、理論物理と実験物理との違いに似てるかも。

      それにシステムバイオロジーに組み込まれて、かつ信頼できる結果が出てくるほどの予測結果ならば、システムバイオロジーに頼らずとも辿り着ける可能性が大きいわけで。そこに至ってない部分を明らかにするのがこちらの仕事ですから。

      そういう意味では、むしろ旧来ながらのバイオインフォマティクスがより信頼できるものになる方がありがたいです。ただし、上の方で「結局は信頼できない」という声がある、という意見がありますが、それは当然の感覚です。基本的にたった一つの実験だけで何かを言えるってことはない、というのが研究なので。どれほど、信頼性が上がろうとも、それだけで何かモノが言える、ということにはならないのです。
      何か一つのことを言うためには、いろいろな角度から見た複数の実験を行って裏付けを取るのが当たり前です。in silicoで立てた予測はin vitro, in vivoで実証できて初めて、正しかったことが判るわけで。それ単独では、どこまでいっても「よくできたモデル」以外の何者でもないですから。

      上の方でshiragaさんも言ってますが、バイオインフォマティクスが最も威力を発揮するのは、1st スクリーニングのときです。
      「今、現在」のニーズで言うならば、自分が研究している遺伝子にほぼ100%有効なRNAi配列が判るようなシステムがあれば、非常に大きなシェアが見込めるでしょう。今だと、デザインから合成まで外注して1件で40万円くらいかかるわけで。これが合成の費用だけでいいとなると、敷居が一気に下がります。

      #まぁ実際、やってる企業は社内に独自のデータベースとアルゴリズムを持っててデザインしてるわけなんですが。
      親コメント
      • 私は以前ウェットな実験をしていて今はドライの方なので、y_tambeさんのおっしゃ
        ることはよくわかります。
        実際、バイオインフォマティクス(このトピックにあわせてこちらの用語を使いま
        す)はまだウェットの実験の結果を使って解析したり新しい手法を開発したりとい
        う段階でそこからのフィードバックはまだまだですね。
        これは必ずしも日本には限りません。

        それはまだ信頼性のある結果を出せないドライ側の問題が大きいわけですが、お互
        いの意思の疎通を図るための様式というか言葉の問題が大きいように思うのですが
        それは研究の対象にはしにくいし、どうとりかかったらいいのかもよくわからない、
        結局ドライ側は「こんなサイトを作りましたよ」という報告ばかりになるし、ウェ
        ット側は「ああそうですか」で結局使わないと。
        (でフィードバックが回らないので信頼性も上がらない)

        > 上の方でshiragaさんも言ってますが、バイオインフォマティクスが最も威力を
        > 発揮するのは、1st スクリーニングのときです。

        その通りだと思います。BLASTがいい例ですよね。そういう意味で

        > 自分が研究している遺伝子にほぼ100%有効なRNAi配列が判るようなシステム

        これ、面白いですね。
        でもRNAiの作動原理が分子レベルで解明されているとは限らない上に分子レベル
        からのシミュレーションには複雑すぎるのでそういうシステムを構築するために
        は多くの「失敗データ」を体系的に解析するしかないと思います。
        でもウェットの人はそういう失敗データは自分の実験ノートの中にしか残さない
        し、他人のデータと比較できるような形では記述しないのでなかなか解析対象に
        ならないし、研究室の中に興味を持って何かをしたいと思う研究者がいたとした
        ら「そんなことするより実験しろ」がウェット研究室の常で。

        ということで、y_tambeさんがデータをお持ちでしたら是非?(笑)

        > #まぁ実際、やってる企業は社内に独自のデータベースとアルゴリズムを持っ
        > ててデザインしてるわけなんですが。

        うーん、日本の製薬会社はどうなんでしょうね。
        新薬開発にかけるお金の数%でいいならやってみようかととりあえずやってみている
        だけの気がしますが。
        ソフトウェア開発会社の方はどこにそんな需要があるのだろう?というような仕事が
        多いし・・・
        --
        kaho
        親コメント
        • >その通りだと思います。BLASTがいい例ですよね。そういう意味で

          BLASTがいちばんの成功例だというのは揺るぎない真実だと思います。ただし、個人的には(自分がやってることもあって)タンパク質質量解析データベースがとても興味深いです。田中耕一氏のノーベル賞受賞で有名になったMALDI-TOF/MSによるペプチドMSフィンガープリント法の解析に使うやつです。

          原理として簡単に言うと、未知タンパク質の試料をトリプシンで消化してその断片の質量を測定するもので、トリプシンがどのアミノ酸のところで切断するかが判っているから、タンパク質データベースにあるアミノ酸配列を切ったときに出来ると予想されるペプチド断片の質量との比較で試料を推定するというものです。

          (実際には末端修飾とかいろいろ条件が付加されるけど)アルゴリズム的にはそこまで高度なものではなくても、タンパク質のアミノ酸配列から(あるいは翻訳前の核酸データベースからでも)、既存の膨大で信頼できるデータをそのまま流用できるというのが、即、実用につながった勝因なのだと思いますね。

          また、アルゴリズムの違いに依存したのでしょうが、オンラインでやっている複数のサービスで結果に差が出てくるのもユニークでした。例えばMS-FIT [ucsf.edu]ではfalse positiveが多いが見落としが少ないが、Mascot [matrixscience.com]ではその逆だ、とか。

          #結局は両方使うんですけどね。
          親コメント
        • >でもRNAiの作動原理が分子レベルで解明されているとは限らない上に分子レベル
          >からのシミュレーションには複雑すぎるのでそういうシステムを構築するために
          >は多くの「失敗データ」を体系的に解析するしかないと思います
          (SNIP)
          >> #まぁ実際、やってる企業は社内に独自のデータベースとアルゴリズムを持っ >> ててデザインしてるわけなんですが。
          >うーん、日本の製薬会社はどうなんでしょうね。

          RNAi,siRNAだと、世界的な最大手がB-Bridge [b-bridge.com](リンク先はB-Bridgeジャパン)なのですが、ここが実際にそういうやり方をやってます。自社で蓄積したデータを元に予測から作成までを行ってて、立体構造的な理由などで元が難しいものでなければ、まず有効なものを作ってくれます。
          ただし当然、社内データは外部には完全非公開、会員登録すれば一部が利用できる、という感じのようです(というのは、登録してないから聞きかじっただけなのですが)

          上のコメントで「今、現在」と強調してるのは、そこらへんの理由もあって、これから後発でスタートさせてもまず既存のものに競合するのが難しいし、またそれまでにもっと新しいシステムが出来てくる可能性が高いんじゃないかと思ってるからです。
          親コメント
      • by flutist (16098) on 2004年02月14日 23時57分 (#495908)
        > いわゆる「システムバイオロジー」の恩恵

        現実的な恩恵は当分ないでしょう。現在のシステムバイオロジーは、生命活動に含まれる部品としての化学反応、パスウェイなどをだんだん大きな視点で見られるようになってきたという段階で、現実の生命現象の予測などを行うのは、まだまだ非実用的です。生命現象を全体的に記述できる数理モデルはまだありません。ERATOの北野プロジェクトやE-cellはがんばってはいますけどね。

        > バイオインフォマティクスが最も威力を発揮するのは、1st スクリーニング

        全くその通り、というのはIT屋もよくわかっています。実用されているのはほとんどDBと統計、がんばってオントロジーくらいなので、あまり情報科学としては面白くはないんだけど、グラント書きやすいというのと、現実世界の問題で腕試しができるという利点は大きいのです。

        > 自分が研究している遺伝子にほぼ100%有効なRNAi配列

        アルゴリズムはいくらでも考えつくわけですが、IT屋には、アルゴリズムをrefineするためのRNAiの詳細な分子機構の知識と、アルゴリズムの有効性を実地で確かめるすべがありません。適当なとこにこのネタでグラント出したら当たるかもしれませんよ。
        親コメント
      • by ledsun (16719) on 2004年02月15日 13時01分 (#496097)
        参考になる
        親コメント
    • by Anonymous Coward
      ITのフィールドといえども、バイオのフィールドといえども、お互いにこういった「ホンネの吐露のしあい」というのが、今まであまりにも無さすぎた。こういったことはとても泥臭いことだし、カッコもよくないけれども、世界に冠たる「バイオとIT」は、結局、こういった地道な、泥

皆さんもソースを読むときに、行と行の間を読むような気持ちで見てほしい -- あるハッカー

処理中...