アカウント名:
パスワード:
https://www.nissin.com/jp/news/11597 [nissin.com]
プレスリリースに実験内容が書いてある
臨床実験2:男女104名を2群にランダムに振り分け、52名に乳酸菌、52名にプラセボを与えた結果:群間での有意差は認められなかった
臨床実験2の追加実験:毛乳頭細胞が少ないことが推測される18名を除いた被験者86名で再実験結果:群で有意差が認められた
前半の実験結果が全てですが、基本的に効果はなく一部の都合が悪い人を除外して無理やり結果をでっち上げたという雰囲気です。p値ハッキングと批判されるべき研究だと思います。
前半の実験結果が全てですが、基本的に効果はなく
この乳酸菌はそうかもしれないし、そうでないかもしれないけど、薬などでは一般的な話だと思います。治療群全体と対照群全体を比較して有意な差が無かったときに、治療群の中にグループや傾向があったら、それを加味して研究するのも仕事だと思うのです。
ある薬が、症状を持っている人全員に効き目があるとわかったら素晴らしいことですが、効く人と効かない人がいる場合に、例えばこういう因子を持っている人になら効く、症状の特定の段階にだけ(初期症状だけとか)効くとかがあれば、それを研究や実験をするものだと思います。
その結
的外れなコメントですねぇ。
可能性はゼロじゃないと言ってるだけのコメント。そんなことは言われなくてもみんな知ってる。
しかも「薬などでは一般的な話」と言ってる割には、統計的有意差の意味さえ理解できてない。特に> 治療群全体と対照群全体を比較して有意な差が無かったときに、治療群の中にグループや傾向があったら、それを加味して研究するのも仕事だと思うのです。これ。多重比較やp値ハッキングの問題を知らずに言ってるんだろうけど、「それを加味して研究する」のは基本NG。普通はこんなコメントはしない。
うーん、そうかなぁ。
例えば、ハゲに効く薬を研究していて、いろんなハゲの人を集めて治療群と対照群に分けて試験してみたら有意差が無かった。このときに治療群に効いている人といない人が混じっているから効く人もいます、と言ってしまうのは NG。
でも個々の結果を調べてみたら、どうもつるっぱげには効かないが、後退し始めの人には効くようだとわかった(でもなんでも効く人と効かない人の差について仮説が立てば良い)。「それを加味して研究する」というのは有意かどうかの判定を含む試験結果の斟酌ではなくて、どのような要因が結果に結びついているかどうかを研究するという意味です。
そこで後退し始めの人たちを集めて、治療群と対照群にわけ(もちろん前の試験での群とは無関係にランダムに分けます)、また別の試験をして(先の試験からデータを抜き取るのではない)、今度は有意差があった。
すると、その薬はハゲ全般に効くとは言えない(効かないという試験結果がもうある)けども、一部のハゲには有意に効き目があると言って差し支えない、というような話です。別の試験、治療群と対照群という二群なら多重比較とは言わないのではと思うのですが。(あくまで例えで今回の乳酸菌がどうだかは知りません。また十分なサンプル数かどうかなどの話も別です。)
逆に、教えてもらえますでしょうか:
ハゲに効く薬を開発していて、いろんなハゲを集めて治療群と対照群に分けて試験したら有意差が無かった。しかし研究を進めていくと初期のハゲ(でも一部のタイプのハゲでもなんでもいいけど)には効くのではないかとの仮説が立った。この仮説を検証するにはどのような試験をすれば良いか。
あるウイルスに効く薬を開発していて、いろんな感染者を集めて治療群と対照群に分けて試験したら有意差が無かった。しかし研究を進めていくと感染から24時間以内であれば効くのではないかとの仮説が立った。この仮説を検証するにはどのような試験をすれば良いか。
あるがんの抗がん剤を開発していて、いろんな患者を集めて治療群と対照群に分けて試験したら有意差が無かった。しかし研究を進めていくと、特定の遺伝子型を持つ患者には効くのではないかとの仮説が立った。この仮説を検証するにはどのような試験をすれば良いか。
コメントは付かないか。残念。
別ACですが・・・
p値というのは、「有意差が無いとした場合、今回の(有意差が表れる)実験結果がたまたま表れる確率はどれくらいか」というものです。通常、p値が5%以下であれば有意差があると判断します。つまり、偶然によって差がでる確率が5%以下であれば、それは稀なので偶然ではないと判断します。
これは20面ダイスを振って1を出すことに似ています。ところで、20面ダイスを振って1回目で1を出すのは難しいですが、振り続けていけば、1を出すことはできるでしょう(おそらく20回目付近で)。
実験についても同様に、繰り返すことで(本当は有意差が無いにもかかわらず)p値が5%以下でてしまう可能性があります。これを多重比較の問題とかp値ハッキングとか言います。
多重比較の問題を解消する手段としてボンフェローニ補正というものがあります。これは実験回数に応じて、2回なら2.5%、3回なら1.67%・・・と、有意差があると判断する水準をより厳しくします。
親コメントに「再実験」とあって、再度実験をしたと思い込んでいたのですが、プレスリリースは「追加解析」なんですね。これだと多重比較か。追試でも無かった。
もし一回の試験で、ハゲの一部を対象(残りを対象にしない)場合、対照群とだけ比較すれば良いのですから、ダネット法でも良さそうですが。
p値の定義は一応理解しているつもりですが、有意水準「p値が5%以下であれば有意差があると判断」する根拠はよくわかっていません。最近は p値が <0.05 かどうかだけではなく、p値そのものを記載するようになっている?
元の話だと、追試をおこなうべきように思いますが、その際の適切なサンプル数が難しそうです。
ところで、20面ダイスを振って1回目で1を出すのは難しいですが、振り続けていけば、1を出すことはできるでしょう(おそらく20回目付近で)。
20回目付近? 0.95^14回≒0.488(または ln(0.5)/ln(0.95)≒13.5)なので、14回も振れば 1が出る確率の方が高いのでは? そういう話ではない?
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
未知のハックに一心不乱に取り組んだ結果、私は自然の法則を変えてしまった -- あるハッカー
眉唾 (スコア:5, 参考になる)
https://www.nissin.com/jp/news/11597 [nissin.com]
プレスリリースに実験内容が書いてある
臨床実験2:男女104名を2群にランダムに振り分け、52名に乳酸菌、52名にプラセボを与えた
結果:群間での有意差は認められなかった
臨床実験2の追加実験:毛乳頭細胞が少ないことが推測される18名を除いた被験者86名で再実験
結果:群で有意差が認められた
前半の実験結果が全てですが、基本的に効果はなく
一部の都合が悪い人を除外して無理やり結果をでっち上げたという雰囲気です。p値ハッキングと批判されるべき研究だと思います。
眉唾? (スコア:2)
前半の実験結果が全てですが、基本的に効果はなく
この乳酸菌はそうかもしれないし、そうでないかもしれないけど、薬などでは一般的な話だと思います。
治療群全体と対照群全体を比較して有意な差が無かったときに、治療群の中にグループや傾向があったら、それを加味して研究するのも仕事だと思うのです。
ある薬が、症状を持っている人全員に効き目があるとわかったら素晴らしいことですが、効く人と効かない人がいる場合に、例えばこういう因子を持っている人になら効く、症状の特定の段階にだけ(初期症状だけとか)効くとかがあれば、それを研究や実験をするものだと思います。
その結
Re: (スコア:1)
的外れなコメントですねぇ。
可能性はゼロじゃないと言ってるだけのコメント。そんなことは言われなくてもみんな知ってる。
しかも「薬などでは一般的な話」と言ってる割には、統計的有意差の意味さえ理解できてない。特に
> 治療群全体と対照群全体を比較して有意な差が無かったときに、治療群の中にグループや傾向があったら、それを加味して研究するのも仕事だと思うのです。
これ。多重比較やp値ハッキングの問題を知らずに言ってるんだろうけど、「それを加味して研究する」のは基本NG。普通はこんなコメントはしない。
Re:眉唾? (スコア:3)
しかも「薬などでは一般的な話」と言ってる割には、統計的有意差の意味さえ理解できてない。特に
> 治療群全体と対照群全体を比較して有意な差が無かったときに、治療群の中にグループや傾向があったら、それを加味して研究するのも仕事だと思うのです。
これ。多重比較やp値ハッキングの問題を知らずに言ってるんだろうけど、「それを加味して研究する」のは基本NG。普通はこんなコメントはしない。
うーん、そうかなぁ。
例えば、ハゲに効く薬を研究していて、いろんなハゲの人を集めて治療群と対照群に分けて試験してみたら有意差が無かった。このときに治療群に効いている人といない人が混じっているから効く人もいます、と言ってしまうのは NG。
でも個々の結果を調べてみたら、どうもつるっぱげには効かないが、後退し始めの人には効くようだとわかった(でもなんでも効く人と効かない人の差について仮説が立てば良い)。「それを加味して研究する」というのは有意かどうかの判定を含む試験結果の斟酌ではなくて、どのような要因が結果に結びついているかどうかを研究するという意味です。
そこで後退し始めの人たちを集めて、治療群と対照群にわけ(もちろん前の試験での群とは無関係にランダムに分けます)、また別の試験をして(先の試験からデータを抜き取るのではない)、今度は有意差があった。
すると、その薬はハゲ全般に効くとは言えない(効かないという試験結果がもうある)けども、一部のハゲには有意に効き目があると言って差し支えない、というような話です。別の試験、治療群と対照群という二群なら多重比較とは言わないのではと思うのですが。
(あくまで例えで今回の乳酸菌がどうだかは知りません。また十分なサンプル数かどうかなどの話も別です。)
逆に、教えてもらえますでしょうか:
ハゲに効く薬を開発していて、いろんなハゲを集めて治療群と対照群に分けて試験したら有意差が無かった。しかし研究を進めていくと初期のハゲ(でも一部のタイプのハゲでもなんでもいいけど)には効くのではないかとの仮説が立った。この仮説を検証するにはどのような試験をすれば良いか。
あるウイルスに効く薬を開発していて、いろんな感染者を集めて治療群と対照群に分けて試験したら有意差が無かった。しかし研究を進めていくと感染から24時間以内であれば効くのではないかとの仮説が立った。この仮説を検証するにはどのような試験をすれば良いか。
あるがんの抗がん剤を開発していて、いろんな患者を集めて治療群と対照群に分けて試験したら有意差が無かった。しかし研究を進めていくと、特定の遺伝子型を持つ患者には効くのではないかとの仮説が立った。この仮説を検証するにはどのような試験をすれば良いか。
Re:眉唾? (スコア:2)
逆に、教えてもらえますでしょうか:
コメントは付かないか。残念。
Re: (スコア:0)
別ACですが・・・
p値というのは、「有意差が無いとした場合、今回の(有意差が表れる)実験結果がたまたま表れる確率はどれくらいか」というものです。
通常、p値が5%以下であれば有意差があると判断します。
つまり、偶然によって差がでる確率が5%以下であれば、それは稀なので偶然ではないと判断します。
これは20面ダイスを振って1を出すことに似ています。
ところで、20面ダイスを振って1回目で1を出すのは難しいですが、
振り続けていけば、1を出すことはできるでしょう(おそらく20回目付近で)。
実験についても同様に、繰り返すことで(本当は有意差が無いにもかかわらず)p値が5%以下でてしまう可能性があります。
これを多重比較の問題とかp値ハッキングとか言います。
多重比較の問題を解消する手段としてボンフェローニ補正というものがあります。
これは実験回数に応じて、2回なら2.5%、3回なら1.67%・・・と、有意差があると判断する水準をより厳しくします。
Re:眉唾? (スコア:2)
親コメントに「再実験」とあって、再度実験をしたと思い込んでいたのですが、プレスリリースは「追加解析」なんですね。これだと多重比較か。追試でも無かった。
もし一回の試験で、ハゲの一部を対象(残りを対象にしない)場合、対照群とだけ比較すれば良いのですから、ダネット法でも良さそうですが。
p値の定義は一応理解しているつもりですが、有意水準「p値が5%以下であれば有意差があると判断」する根拠はよくわかっていません。最近は p値が <0.05 かどうかだけではなく、p値そのものを記載するようになっている?
元の話だと、追試をおこなうべきように思いますが、その際の適切なサンプル数が難しそうです。
ところで、20面ダイスを振って1回目で1を出すのは難しいですが、
振り続けていけば、1を出すことはできるでしょう(おそらく20回目付近で)。
20回目付近? 0.95^14回≒0.488(または ln(0.5)/ln(0.95)≒13.5)なので、14回も振れば 1が出る確率の方が高いのでは? そういう話ではない?