アカウント名:
パスワード:
Fig4が主張の根拠になっているみたいですが外れ値と称して解析から外してる値が沢山あるように見えますがこれはなんなんでしょうね。この外れ値を解析に入れると平均地が引き上がりそうですが。
後は、空間線量と実際の被爆量の関係に回帰直線を引くと従来想定されていたシナリオより傾きが緩やかだったという事のようですがヒストグラムを見るとそもそも政府の安全基準である0.23μSv/hを満たしていない地域が殆どのように見えます。
結論と図をナナメ読みしただけなので間違っていたらゴメンナサイ。
統計上、他の値から極端に外れていて、測定ミスや別要因による誤差が考えられるような値だから外して正解だよ。それを解析にいれると平均値がどうなるかも然程関係ない。
たとえば、人間5人の身長を測定したとき160cm 170cm 170cm 160cm 170mというデータが得られたとする。最後の170mはどう考えてもおかしいよねってことで除外するのは常識的な対応だ。(これは別に「常識的におかしい」とい
統計を使えば外すべき外れ値がおのずと判明する思っていませんか?データが与えられただけでは何が飛び離れ点か判別することは出来ず、除外するには必ず何らかの仮定が存在します。例えば母集団の分布型の仮定であったり、背景にあるモデルを仮定したりするわけで論文にはデータを除外した根拠を書く必要があります。分布に対する仮定が必要無さそうに見えるブートストラップであったとしても中心極限定理に従うという仮定が入ります。
論文の中にJapanese-government value of 0.6というのがあるのだけれど、基準の見直しでもするようですね。
係数0.6(Fig.4の青ライン)だと超過側にはみ出るのが0.7%ということですが、何σとるのが妥当なのでしょうね。
(分布の低い方の片側は全数含むとして、多い方だけ考えて、はみ出す割合が0.7%だと平均から2.5σ弱くらいってことでいいのかな…Fig.5を見ると、係数0.55くらいだと超過割合が1%、係数0.82くらいだと0.1%のようです。pdfのFig.5を拡大すると確認できます。)
はみ出たからと言って直ぐにどうかなるわけではありませんが…判断が意外と難しいですね。あとおっしゃる通り、もう少し線量の高い所(「0.23μSv/hを満たしていない地域」を考慮するため)が見たいけど、Fig.4のa)とb)の縦軸(特にa)を何とかして欲しい。
ごめんなさい間違ってました。0.23μSv/hを満たしていない地域は逆に低い方って意味でしたね。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
あと、僕は馬鹿なことをするのは嫌いですよ (わざとやるとき以外は)。-- Larry Wall
ざっと見た感じ (スコア:0)
Fig4が主張の根拠になっているみたいですが
外れ値と称して解析から外してる値が沢山あるように見えますがこれはなんなんでしょうね。
この外れ値を解析に入れると平均地が引き上がりそうですが。
後は、空間線量と実際の被爆量の関係に回帰直線を引くと従来想定されていたシナリオより傾きが緩やかだったという事のようですが
ヒストグラムを見るとそもそも政府の安全基準である0.23μSv/hを満たしていない地域が殆どのように見えます。
結論と図をナナメ読みしただけなので間違っていたらゴメンナサイ。
Re: (スコア:0)
統計上、他の値から極端に外れていて、測定ミスや別要因による誤差が考えられるような値だから外して正解だよ。
それを解析にいれると平均値がどうなるかも然程関係ない。
たとえば、人間5人の身長を測定したとき
160cm 170cm 170cm 160cm 170m
というデータが得られたとする。最後の170mはどう考えてもおかしいよねってことで除外するのは常識的な対応だ。
(これは別に「常識的におかしい」とい
Re:ざっと見た感じ (スコア:1)
統計を使えば外すべき外れ値がおのずと判明する思っていませんか?
データが与えられただけでは何が飛び離れ点か判別することは出来ず、除外するには必ず何らかの仮定が存在します。
例えば母集団の分布型の仮定であったり、背景にあるモデルを仮定したりするわけで論文にはデータを除外した根拠を書く必要があります。
分布に対する仮定が必要無さそうに見えるブートストラップであったとしても中心極限定理に従うという仮定が入ります。
ディレーティング係数みたいなもの? (スコア:0)
論文の中にJapanese-government value of 0.6というのがあるのだけれど、基準の見直しでもするようですね。
係数0.6(Fig.4の青ライン)だと超過側にはみ出るのが0.7%ということですが、何σとるのが妥当なのでしょうね。
(分布の低い方の片側は全数含むとして、多い方だけ考えて、はみ出す割合が0.7%だと平均から2.5σ弱くらいってことでいいのかな…Fig.5を見ると、係数0.55くらいだと超過割合が1%、係数0.82くらいだと0.1%のようです。pdfのFig.5を拡大すると確認できます。)
はみ出たからと言って直ぐにどうかなるわけではありませんが…判断が意外と難しいですね。あとおっしゃる通り、もう少し線量の高い所(「0.23μSv/hを満たしていない地域」を考慮するため)が見たいけど、Fig.4のa)とb)の縦軸(特にa)を何とかして欲しい。
Re: (スコア:0)
ごめんなさい間違ってました。0.23μSv/hを満たしていない地域は逆に低い方って意味でしたね。