アカウント名:
パスワード:
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
にわかな奴ほど語りたがる -- あるハッカー
毒を吐く人が多いなあ (スコア:3, 参考になる)
トピックとは関係ない部分でも悪態をつく人が多いようなので辟易して止めます。
このコンテストの審査員が文科省関連の方が多いのは主催(というか予算の流れ)
からみても当たり前で、表彰式の行われる会場では文科省の方がスピーチをしたり
するわけです。
IT関連の人材発掘のために行われているように勘違いされている方も多いようです
が、実際のところはこのコンテストの課題は現実に生物学における大量のデータ処
理を行うに当たって必要な技術が求められており、これから生物学を志す学生や若
kaho
Re:毒を吐く人が多いなあ (スコア:2, 参考になる)
ウェットな実験をやっている立場からすると、正直、いわゆる「システムバイオロジー」の恩恵にこそあんまり期待してなかったりします。どっちかというと元データを捻出する側ですから。
#ある意味、理論物理と実験物理との違いに似てるかも。
それにシステムバイオロジーに組み込まれて、かつ信頼できる結果が出てくるほどの予測結果ならば、システムバイオロジーに頼らずとも辿り着ける可能性が大きいわけで。そこに至ってない部分を明らかにするのがこちらの仕事ですから。
そういう意味では、むしろ旧来ながらのバイオ
Re:毒を吐く人が多いなあ (スコア:2, 参考になる)
ることはよくわかります。
実際、バイオインフォマティクス(このトピックにあわせてこちらの用語を使いま
す)はまだウェットの実験の結果を使って解析したり新しい手法を開発したりとい
う段階でそこからのフィードバックはまだまだですね。
これは必ずしも日本には限りません。
それはまだ信頼性のある結果を出せないドライ側の問題が大きいわけですが、お互
いの意思の疎通を図るための様式というか言葉の問題が大きいように思うのですが
それは研究の対象にはしにくいし、どうとりかかったらいいのかもよくわからない、
結局ドライ側は「こんなサイトを作りましたよ」という報告ばかりになるし、ウェ
ット側は「ああそうですか」で結局使わないと。
(でフィードバックが回らないので信頼性も上がらない)
> 上の方でshiragaさんも言ってますが、バイオインフォマティクスが最も威力を
> 発揮するのは、1st スクリーニングのときです。
その通りだと思います。BLASTがいい例ですよね。そういう意味で
> 自分が研究している遺伝子にほぼ100%有効なRNAi配列が判るようなシステム
これ、面白いですね。
でもRNAiの作動原理が分子レベルで解明されているとは限らない上に分子レベル
からのシミュレーションには複雑すぎるのでそういうシステムを構築するために
は多くの「失敗データ」を体系的に解析するしかないと思います。
でもウェットの人はそういう失敗データは自分の実験ノートの中にしか残さない
し、他人のデータと比較できるような形では記述しないのでなかなか解析対象に
ならないし、研究室の中に興味を持って何かをしたいと思う研究者がいたとした
ら「そんなことするより実験しろ」がウェット研究室の常で。
ということで、y_tambeさんがデータをお持ちでしたら是非?(笑)
> #まぁ実際、やってる企業は社内に独自のデータベースとアルゴリズムを持っ
> ててデザインしてるわけなんですが。
うーん、日本の製薬会社はどうなんでしょうね。
新薬開発にかけるお金の数%でいいならやってみようかととりあえずやってみている
だけの気がしますが。
ソフトウェア開発会社の方はどこにそんな需要があるのだろう?というような仕事が
多いし・・・
kaho
Re:毒を吐く人が多いなあ (スコア:1)
BLASTがいちばんの成功例だというのは揺るぎない真実だと思います。ただし、個人的には(自分がやってることもあって)タンパク質質量解析データベースがとても興味深いです。田中耕一氏のノーベル賞受賞で有名になったMALDI-TOF/MSによるペプチドMSフィンガープリント法の解析に使うやつです。
原理として簡単に言うと、未知タンパク質の試料をトリプシンで消化してその断片の質量を測定するもので、トリプシンがどのアミノ酸のところで切断するかが判っているから、タンパク質データベースにあるアミノ酸配列を切ったときに出来ると予想されるペプチド断片の質量との比較で試料を推定するというものです。
(実際には末端修飾とかいろいろ条件が付加されるけど)アルゴリズム的にはそこまで高度なものではなくても、タンパク質のアミノ酸配列から(あるいは翻訳前の核酸データベースからでも)、既存の膨大で信頼できるデータをそのまま流用できるというのが、即、実用につながった勝因なのだと思いますね。
また、アルゴリズムの違いに依存したのでしょうが、オンラインでやっている複数のサービスで結果に差が出てくるのもユニークでした。例えばMS-FIT [ucsf.edu]ではfalse positiveが多いが見落としが少ないが、Mascot [matrixscience.com]ではその逆だ、とか。
#結局は両方使うんですけどね。
Re:毒を吐く人が多いなあ (スコア:1)
>からのシミュレーションには複雑すぎるのでそういうシステムを構築するために
>は多くの「失敗データ」を体系的に解析するしかないと思います
(SNIP)
>> #まぁ実際、やってる企業は社内に独自のデータベースとアルゴリズムを持っ >> ててデザインしてるわけなんですが。
>うーん、日本の製薬会社はどうなんでしょうね。
RNAi,siRNAだと、世界的な最大手がB-Bridge [b-bridge.com](リンク先はB-Bridgeジャパン)なのですが、ここが実際にそういうやり方をやってます。自社で蓄積したデータを元に予測から作成までを行ってて、立体構造的な理由などで元が難しいものでなければ、まず有効なものを作ってくれます。
ただし当然、社内データは外部には完全非公開、会員登録すれば一部が利用できる、という感じのようです(というのは、登録してないから聞きかじっただけなのですが)
上のコメントで「今、現在」と強調してるのは、そこらへんの理由もあって、これから後発でスタートさせてもまず既存のものに競合するのが難しいし、またそれまでにもっと新しいシステムが出来てくる可能性が高いんじゃないかと思ってるからです。