アカウント名:
パスワード:
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
あつくて寝られない時はhackしろ! 386BSD(98)はそうやってつくられましたよ? -- あるハッカー
評価者の問題? (スコア:5, 参考になる)
> それぞれ「3.867」と「3.667」という評価しか得られなかったとのこと
> (結果の一覧はこちら)。テストの手順が悪いのか、何かが人間性を失わせているのか?
> はたまた、人間ですら4点も取れないテストなら、
> AIも結構イケてる、と考えるかは意見の分かれるところだ。"
結 [surrey.ac.uk]
だが、いいこともあるぞ、外の天気は上々なんだ
Re:評価者の問題? (スコア:2, 興味深い)
ジャッジが9人じゃサンプル数があまりに少なすぎて、個々の資質に左右されすぎると思うんですが。
統計学的には最小値と最大値って除外するんじゃ…?詳しい人のフォローを期待します。
# rm -rf ./.
Re:評価者の問題? (スコア:1)
統計の教科書には、恣意的にデータを捨てると正しい結果が 得られない、というようなことが書いてあります。 また、明らかに間違っている入力は捨てるべし、とも 書いてあります。 J9が採点基準を誤解していたとか、恣意的な採点をしていたとか いうのなら、除外して平均を取っても良いでしょう。
最高点と最低点は除外すべきかと (スコア:1)
さすがにコンピュータで無作為に抽出とかまでしたら、ちょとやり過ぎかもしれないけど。(w;
最高点と最低点は恣意的なものという前提で除外すれば、平均値が全体の平均として納得のいく数値になるような気がします。
もともとそういった感覚の違いを吸収するための、手段の一つだったはずだし。
--- どちらなりとご自由に --- --