アカウント名:
パスワード:
大学の講義の一環として、アンケートの集計をした。平均値だけでなく分散なども求めて、ヒストグラムを描いて、2つの集団の平均値の差の検定もやって、やっと分かったように思う。高校の数学Cでも分散などを勉強したはずだけれど、今の方が理解度は上がっているはず。
# 集団の代表値として平均が妥当なのかの検討はあまりされないよなあ。# 年間の所得は区分けをして最頻値を出すほうがよさそうかな?
健康食品・美容関係のテレビショッピングなんかを見ていて、骨年齢とか肌年齢とかでてきますが、出てくる人のほとんどは平均値から大きくかけ離れた人ばかりで、みんな驚いている様子がありますね。テレビショッピングのあの放送の勢いで、例えば:
日本人の80%以上で骨年齢が実年齢を15歳以上上回っているという研究データがあります。
などと放送されたら、それについて何の疑いも持たずに真に受ける主婦なんかが多数いそうですよねぇ。
つまりはこの場合は、残りの20%の中に骨年齢がずば抜けて若い人たちが(飛んだ値)存在していて、それで平均値を押し下げている、ということなのでしょうけど(※1)、そういうことまで理解するには、単純に「平均値=合計÷母数」という式の丸暗記だけではだめで、分散を含めてデータを見なければいけないということを示してると思います。
そういったことまで考えると「平均値とはどんなものか」を本当の意味で理解するには、実際に使ってみないと理解できないかもしれませんねぇ。(゚ω^* )
※1 … あるいは、骨年齢の定義が日本人全体の平均値ではなく、どこか外国の平均値であるとか、世界中の人の平均値であるとかという可能性もありますね。
模試の成績とかで,別の模試の母集団から偏差値を求めて,合格確率が云々とかあったなぁ.
本で,統計で騙されない方法とか書いてる本があっても,結局書いてあることは,平均と最頻値は違うとか,母集団がちがうとか当たり前のことしか書いてないし.
統計的な数値だけじゃありませんけど、データというものは、まとめ方次第で、いかようにでも都合よく加工できるので、騙されないように、気を付けたいところですよねぇ。
データだけでなく、物事の因果関係の推論などでもそういうふうに思うこともあります。たとえば、ある人がの古傷が痛くなった次の日には必ず雨が降る、という事実がある場合に、
古傷が痛くなる ⇒ 雨が降る
と、いうふうに因果関係を推論したとすれば、日照りが続いて、雨が降ってほしいときに、その人の古傷を叩いたり、蹴ったりして痛くさせればよい…、となってしまいます。こういったことがいわゆる雨乞いの儀式といった、民間信仰のようなものになっていくのかとおもいます。(実際には古傷で雨乞いをしている文化なんかないでしょうけど…)
この場合の間違いは、因果関係の推論の仕方にあるわけですよね。実際のところは、
・低気圧 ⇒ 古傷が痛くなる ・低気圧 ⇒ 雨が降る
という関係(恐らく)だけれども、古傷が痛くなるのが、雨が降るのよりも、時間的に先だ、ということから、古傷が雨の原因だろうと推論した、というわけです。
健康食品とか美容関係の商品のテレビショッピングの番組の内容には、そういったところを誤解させるような、短絡的なものが多いように思われます。たとえば、その商品を使わない場合の《リファレンス条件》が設定されていない「検証」番組は、よくあります。
民間信仰や「ジンクス」や「都市伝説」なんかに、惑わされないようにするには、やはり、物事の考え方を訓練している必要があるかもしれません。そのためにも日々精進しないと… ですね。( ̄∀ ̄)
だいたいは「母集団の選定がおかしい」という根本的に意味のないアンケートですので・・・「街角/電話調査/インターネットでアンケートに答えてくれた人」っていうのがそもそも偏ってるんですよ普通。ランダムに選んだ人たちに強制的にお答え願えるかっていうと難しいのは分かるんですけどね。
そうですよねぇ。母集団の問題もありますよねぇ。忙しくてアンケートに時間を割けない人、興味のない人、アンケートに嫌悪感がある人、外に出歩かない人、人里離れた地域や離島の人、仕事中の人、夜勤の人、病人など寝たきりの人、そして恐らく、聾唖・盲目の人など、は母集団に入っていませんもんねぇ。
テレビでよく、「サラリーマンの声」として、新橋駅の近くの人に声を聞けているテレビ番組がありますけど、あれは、「新橋駅付近を昼間の時間通りかかるようなサラリーマン」であって、おそらくは、営業系の人などに偏っているのではないでしょうかねぇ。あの場所では、技術者、運送業者(郵便・宅配・タクシー・トラックなど)、流通系(スーパー、百貨店、家電などの店員)、自衛官、警察官、料理人(シェフ、板前、ラーメン屋など含む)、漁師、建築施工業者、道路工事施工業者、電気工事施工業者、庭師、スポーツ関係者(選手、トレーナーなど)、自動車製造関連、半導体製造関連、……… などなど、挙げれば枚挙に暇がないほどのたくさんの人たちは、ほとんど、入っていないわけですよねぇ。
それに、質問の内容によっては、正直に答えないものもあるとおもいますし。(セックスの回数だとか、年収だとか…)
アンケートって一体何なのでしょうねぇ… (≧∇≦)
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
ハッカーとクラッカーの違い。大してないと思います -- あるアレゲ
実際に使ってみて、初めて理解できた(気がする) (スコア:2)
大学の講義の一環として、アンケートの集計をした。
平均値だけでなく分散なども求めて、ヒストグラムを描いて、2つの集団の平均値の差の検定もやって、やっと分かったように思う。
高校の数学Cでも分散などを勉強したはずだけれど、今の方が理解度は上がっているはず。
# 集団の代表値として平均が妥当なのかの検討はあまりされないよなあ。
# 年間の所得は区分けをして最頻値を出すほうがよさそうかな?
Re:実際に使ってみて、初めて理解できた(気がする) (スコア:1)
健康食品・美容関係のテレビショッピングなんかを見ていて、骨年齢とか肌年齢とかでてきますが、出てくる人のほとんどは平均値から大きくかけ離れた人ばかりで、みんな驚いている様子がありますね。テレビショッピングのあの放送の勢いで、例えば:
などと放送されたら、それについて何の疑いも持たずに真に受ける主婦なんかが多数いそうですよねぇ。
つまりはこの場合は、残りの20%の中に骨年齢がずば抜けて若い人たちが(飛んだ値)存在していて、それで平均値を押し下げている、ということなのでしょうけど(※1)、そういうことまで理解するには、単純に「平均値=合計÷母数」という式の丸暗記だけではだめで、分散を含めてデータを見なければいけないということを示してると思います。
そういったことまで考えると「平均値とはどんなものか」を本当の意味で理解するには、実際に使ってみないと理解できないかもしれませんねぇ。(゚ω^* )
※1 … あるいは、骨年齢の定義が日本人全体の平均値ではなく、どこか外国の平均値であるとか、世界中の人の平均値であるとかという可能性もありますね。
そういえば (スコア:0)
模試の成績とかで,別の模試の母集団から偏差値を求めて,合格確率が云々とかあったなぁ.
本で,統計で騙されない方法とか書いてる本があっても,結局書いてあることは,
平均と最頻値は違うとか,母集団がちがうとか当たり前のことしか書いてないし.
Re:そういえば (スコア:1)
統計的な数値だけじゃありませんけど、データというものは、まとめ方次第で、いかようにでも都合よく加工できるので、騙されないように、気を付けたいところですよねぇ。
データだけでなく、物事の因果関係の推論などでもそういうふうに思うこともあります。たとえば、ある人がの古傷が痛くなった次の日には必ず雨が降る、という事実がある場合に、
と、いうふうに因果関係を推論したとすれば、日照りが続いて、雨が降ってほしいときに、その人の古傷を叩いたり、蹴ったりして痛くさせればよい…、となってしまいます。こういったことがいわゆる雨乞いの儀式といった、民間信仰のようなものになっていくのかとおもいます。(実際には古傷で雨乞いをしている文化なんかないでしょうけど…)
この場合の間違いは、因果関係の推論の仕方にあるわけですよね。実際のところは、
という関係(恐らく)だけれども、古傷が痛くなるのが、雨が降るのよりも、時間的に先だ、ということから、古傷が雨の原因だろうと推論した、というわけです。
健康食品とか美容関係の商品のテレビショッピングの番組の内容には、そういったところを誤解させるような、短絡的なものが多いように思われます。たとえば、その商品を使わない場合の《リファレンス条件》が設定されていない「検証」番組は、よくあります。
民間信仰や「ジンクス」や「都市伝説」なんかに、惑わされないようにするには、やはり、物事の考え方を訓練している必要があるかもしれません。そのためにも日々精進しないと… ですね。( ̄∀ ̄)
Re: (スコア:0)
だいたいは「母集団の選定がおかしい」という根本的に意味のないアンケートですので・・・
「街角/電話調査/インターネットでアンケートに答えてくれた人」っていうのがそもそも偏ってるんですよ普通。
ランダムに選んだ人たちに強制的にお答え願えるかっていうと難しいのは分かるんですけどね。
Re:実際に使ってみて、初めて理解できた(気がする) (スコア:1)
そうですよねぇ。母集団の問題もありますよねぇ。忙しくてアンケートに時間を割けない人、興味のない人、アンケートに嫌悪感がある人、外に出歩かない人、人里離れた地域や離島の人、仕事中の人、夜勤の人、病人など寝たきりの人、そして恐らく、聾唖・盲目の人など、は母集団に入っていませんもんねぇ。
テレビでよく、「サラリーマンの声」として、新橋駅の近くの人に声を聞けているテレビ番組がありますけど、あれは、「新橋駅付近を昼間の時間通りかかるようなサラリーマン」であって、おそらくは、営業系の人などに偏っているのではないでしょうかねぇ。あの場所では、技術者、運送業者(郵便・宅配・タクシー・トラックなど)、流通系(スーパー、百貨店、家電などの店員)、自衛官、警察官、料理人(シェフ、板前、ラーメン屋など含む)、漁師、建築施工業者、道路工事施工業者、電気工事施工業者、庭師、スポーツ関係者(選手、トレーナーなど)、自動車製造関連、半導体製造関連、……… などなど、挙げれば枚挙に暇がないほどのたくさんの人たちは、ほとんど、入っていないわけですよねぇ。
それに、質問の内容によっては、正直に答えないものもあるとおもいますし。(セックスの回数だとか、年収だとか…)
アンケートって一体何なのでしょうねぇ… (≧∇≦)