日経の記事にはコクラン・マンテル・ヘンツェル検定を使ったと書いてあるので、GNU R でその検定 http://sekhon.berkeley.edu/stats/html/mantelhaen.test.html をやってみようと思いましたが、記事から分かることだけを使ってやってみようとするとエラーになります。
> data <- array(c(1260,14,1145,9),dim=c(2,2,1),dimnames=list(plasma=c("yes","no"),response=c("healthy","infected"))) > data , , 1
response plasma healthy infected
yes 1260 1145
no 14 9
「p 値片側 10 %」 (スコア:0)
「p 値片側 10 %」の解釈ですが、
「このような試験を何回も行ったとき、今回のような結果が《偶然》でてしまう可能性も、10回中 1回ぐらいはある。つまり、今回の結果から、プラズマクラスターの効果がある!と主張するには、10回のうち9回に賭けるぐらいのバクチだよ」という意味でよろしいですか?
# うちもプラズマクラスター買ったんだけどなあ…
Re:「p 値片側 10 %」 (スコア:1)
あと、検定対象の信頼出来るモデルが必要。「インフルエンザ感染がこれこれという確率分布で発生すると仮定した場合には、」のような条件が付く。
以下、雑な説明しかできないけど、例えば、「インフルエンザは家庭内でうつりやすい」というのを組み込むか否か。
今回の実験の差は5人だけど、もしインフルエンザが家族内でうつりまくる病気だったなら、この5人差というのは「ある1つの5人家族が偶然かからなかっただけかも?」とも考えられる。9人対14人なので、「イオン有りは2家族が、イオン有りは3家族がインフルエンザにかかりました」みたいな。
「家庭内でうつりやすさを」=「赤の他人との間でのうつりやすさ」と考えると、5人の差を偶然として片付けるには「ある人1人が偶然かからなかっただけかも?」が5回も起こったと主張しないといけない。
とか、検定方法にもバイアスをかける事ができるから、正確な判断はなかなか難しい。むしろ、生の数字をそのまま見た印象の方が騙されにくい気がする。
Re: (スコア:0)
概ねその解釈でよいと思うのですが,私が手元で計算したところだとFisherの精確確率検定ではP値0.53,カイ二乗検定ではP値0.42なんですよね.
これ,計算方法がヤバい気がします.
Re:「p 値片側 10 %」 (スコア:2, 興味深い)
イオンあり群と,なし群で観察延べ日数が違うので,主要評価項目は「合計発生件数 / 合計観察日数」としているようです。
イオンあり イオンなし
患者数 9 14
非患者数 1145 1260
観察日数 219057 237167
主評患者 4.11E-05 5.90E-05
主評非患 5.23E-03 5.31E-03
単純にこの表の主要評価項目を分析(95%の信頼区間)すると,
ピアソンのカイ二乗:0.291
Fisherの正確確率 左側片側:0.387
(Fisherの正確確率 両側:p=0.342)
オッズ比:0.707 オッズ比信頼区間:0.130-3.842
でした。というわけで,ピアソンのカイ二乗検定で10%で有意。オッズ比から「イオンあり群」の罹患率は「なし群」の約70%(つまり3割の削減効果)という今回の報告に近い数値が出てきます。
#計算大丈夫かな?
日経の記事はどのようにオッズ比を計算しているのかわかりません。
ただ,その後の実験環境についての疑問点はよく押さえてあります。
なお,主要評価項目でなく患者数,非患者数で計算すると「Fisherの精確確率検定ではP値0.53,カイ二乗検定ではP値0.42」が出てきます。
Re:「p 値片側 10 %」 (スコア:1)
http://sekhon.berkeley.edu/stats/html/mantelhaen.test.html
をやってみようと思いましたが、記事から分かることだけを使ってやってみようとするとエラーになります。
> data <- array(c(1260,14,1145,9),dim=c(2,2,1),dimnames=list(plasma=c("yes","no"),response=c("healthy","infected")))
> data
, , 1
response
plasma healthy infected
yes 1260 1145
no 14 9
> mantelhaen.test(data)
以下にエラー mantelhaen.test(data) :
テーブルの各次元は 2 以上である必要があります
>
記事にあること以外にデータまたはデータに関する記述が必要なようです。
Re: (スコア:0)
Re: (スコア:0)
これは両側検定じゃないですか?
こちらでも両側検定だと0.53になりますが、これは
「違いがあるかどうか」なので「イオン有り群がイオン無し群より発症しやすいか?」
まで入った検定になりますね。
片側検定(イオン無し群はイオン有り群より発症する確率は大きい)で検定するとp値は0.28になりました。
カイ二乗検定では0.42になるのは一緒でしたが、こちらも「違いがあるかどうか」の両側検定ですね。
Re: (スコア:0)
正確確率検定やカイ二乗検定は両側検定ですから、片側10%=両側20%なので、
手法によってはそれぐらいの違いはあり得るかな、と思います。
「P=0.1で傾向がある」の解釈としては、こんなのを思いつきます。
「コイントスで3回続けて表が出た(P=0.125)→オレにはコインの表を出やすくする能力があるみたいだ」