アカウント名:
パスワード:
そこまでサンプリングについて分かっていながら「さぼりすぎ」とまでお書きになるというのは解せませんね。
#1411590のコメントでは「なんかもったいないように思う」と書かれていますが、「さぼりすぎ」というのは「なんかもったいない」などというよりはるかに強い批判と考えますので、ちょっとコメントさせてもらいます。 # 論文の査読で「さぼりすぎ」と判断されれば、通常はrejectではないでしょうか。 # よくて「実験を追加して再投稿」くらいでは。
結局は「想定される限り完全な研究しか受け入れられない」という主張のように取れるのですが、それはハードル
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
計算機科学者とは、壊れていないものを修理する人々のことである
研究者さぼりすぎ (スコア:1, 興味深い)
>世界の牧草地308か所の写真に写っていた牛8510頭を調べた結果、大半が北か南を向いていた。
>その方位を平均すると、地軸の南北より、少しずれた地磁気の南北に近かった。
どう考えても牛は8510頭以上写ってるし、牧草地は308箇所以上ある。
きっと手作業でやって途中で飽きたか満足してしまったんだろうな。
Re: (スコア:3, すばらしい洞察)
例えば内閣の支持率を調べるのに日本人全員からアンケートを取る必要はありません。
日本の場合は1000人とか2000人ですね。
母集団の数と最終的に求める精度からサンプル数を決定する手法は、統計学では基礎の基礎です。
http://aoki2.si.gunma-u.ac.jp/lecture/SampleSize/index.html [gunma-u.ac.jp]
そもそも、論文が学会誌に掲載されるためには査読というプロセスを通過する必要があります。
素人が直感で思いつくような問題点が残っている論文は査読に通りません。
Re: (スコア:3, 参考になる)
>例えば内閣の支持率を調べるのに日本人全員からアンケートを取る必要はありません。
>日本の場合は1000人とか2000人ですね。
>母集団の数と最終的に求める精度からサンプル数を決定する手法は、統計学では基礎の基礎です。
このような測定は、一様にランダムにサンプルがとれることが前提条件として必要です。例えば、山間部、都市部、あるいは首相の出身県にサンプルが偏ってしまえば結果は全く異なったものになるでしょう。たまたま内閣支持率の場合、国民を電話帳からかなりランダムに選べる。それですら、報道各社の発表する数字には1割近い誤差が発生することもあるわけです。
ハッブル宇宙望遠鏡の有名な測定
Re: (スコア:0)
そこまでサンプリングについて分かっていながら「さぼりすぎ」とまでお書きになるというのは解せませんね。
#1411590のコメントでは「なんかもったいないように思う」と書かれていますが、「さぼりすぎ」というのは「なんかもったいない」などというよりはるかに強い批判と考えますので、ちょっとコメントさせてもらいます。
# 論文の査読で「さぼりすぎ」と判断されれば、通常はrejectではないでしょうか。
# よくて「実験を追加して再投稿」くらいでは。
結局は「想定される限り完全な研究しか受け入れられない」という主張のように取れるのですが、それはハードル
Re:研究者さぼりすぎ (スコア:1)
僕がこの問題に挑戦するならば、、
------
GoogleEarthのデータはある時点で70TBほどだったそうです。でもこの研究の対象とする牛を探索したいならば、70TBもダウンロードする必要はないんです。
ここ [google-earth-travel.net]には世界最大の牧場があるそうなのですが、牛がいることはわかっても牛がどっちを向いているのか判定するのは不可能です。というわけで、第一段階の探索で、GoogleEarthから高解像度の画像が含まれているエリアに絞り込みます。
↑実はこの段階で研究の前提は破綻している。このような方法で、地磁気との因果関係が示せるとも思えないけど、、、
↑因果関係がなくても相関関係はでるからね。
一方で、牛の向きを決定するならば、GoogleEarthの最大解像度なデータは不必要だということも分かります。たとえば、GoogleMapで牛を探すとこんな感じ [google.co.jp]で牛の耳の向きまで見えるようなデータも含まれています。これが70TBの正体です。最大の牧場 [google-earth-travel.net]のイメージ程度の解像度で、(1)牛らしきものが判定できて、(2)その1段階程度拡大するとかなりの確度で牛であることがわかり、(3)もう二段階拡大すると明らかに向きを決定できるでしょう。でも実際のデータはその10倍以上の解像度まで存在しています。
(1)や(2)の画像で、牛らしきものがいないエリアを排除すれば、おそらく牛のいない場所は排除できるでしょう。このときダウンロードしなければならないデータは解像度が低いのでごく僅かです。この段階で面積率で1万分の1以下になるでしょう(地上をまっすぐに100mあるいて1m以上の牛に平均一度以上衝突しないと仮定)。さらに最大解像度まで10倍以上(データサイズにして100倍以上)の開きがあります。したがって次の段階でダウンロードしなければならないデータは70TBのうちの百万分の一程度、すなわち7MB程度です。
画像処理がうまくいかなくて牛じゃない何かを牛の1000倍ヒットしたとしても、7GB程度になります。
そのデータを10倍拡大してダウンロードして70GB、そこから牛じゃない何かを削除したら700MB
その段階で牛飼いを発見! [google-earth-travel.net]して凹んだりするかもしれないけど、
実際のところ、ほとんどの牛は人間様が飼育しているから、人間に強くかかわっていそうなサンプルを消したら(人工の構造物に囲まれているなど)1割以下に絞り込める。こうやって絞り込んだ数十MBのデータを5人くらいで一ヶ月よってたかってチェックして明らかな異常データを撥ねたら計算機で牛の向きを計算する。
----
そりゃぁ実際には技術的な困難がでてくるだろうけど、最初っから無理だと決め付けなくてもいいと思う。
情報系の学生の課題としては重くない。