「大学入学試験合格」を目指す人工知能、偏差値47.3を達成 49
ストーリー by hylom
AIはいつ人間を超えるか 部門より
AIはいつ人間を超えるか 部門より
insiderman 曰く、
東京大学の入学試験に合格することを目指す工知能開発プロジェクト「ロボットは東大に入れるか」の成果報告会が行われた(NHKニュース、ロボットは東大に入れるか」成果報告会 in 2014(11/2)レポート)。
センター試験の結果は900点万点中392点で、偏差値としては47.3に相当するという。また、文系3科目に絞った場合の偏差値は53.4となるそうだ。
具体的な点数については、数学が95点(200点満点中)、物理は31点(100点満点中)、英語が95点(200天満点中)、現代文が58点、世界史Bが52点、日本史が44点、政経が17点(それぞれ100点満点中)。
点数も興味深いが、それ以上に解法についての解説が面白い。こういった試験問題を人工知能が解くためには、問題文を人工知能が解析しやすい形に変換する必要があり、科目ごとにそれぞれ特化したアプローチを使っているという。
それってズルでは? (スコア:3)
Re:それってズルでは? (スコア:1)
数学の問題とか図がある場合はズルっぽいですね。
人間が図の構造を代わりに理解してやってるようだし。
でも、文章問題は人間は xml に変換するくらいしかやってないとするなら、
まあ、その程度は良いんじゃないですか?
Re:それってズルでは? (スコア:3)
Re: (スコア:0)
そのうち将棋みたいに勝ち越されて擁護する奴がでてくるんじゃね?
Re: (スコア:0)
次にお前は「試験場に自分で来て、机に向かってエンピツと消しゴムで答案を書かなければ自力で解いたとは認めない」と言い出すッ!
Re: (スコア:0)
なんだ、がっしゃんがっしゃんと歩いて試験場に入ってきて席に着き、
答案用紙や問題が前からまわってきたら自分の分を取って後ろに回して、
開始の掛け声と共に、ページをめくって問題を読んで、
鉛筆握ってマークシートに記入するようなのを想像していたのに、違うのか。
上げ膳据え膳付きの、中国語の部屋なのね。
二次試験で小論文とか出てきたらどうするつもりなんだろう。
Re:それってズルでは? (スコア:1)
誰もが「二足歩行で歩いて手で椅子を引いて座り鉛筆を手に持って筆記するヒト型ロボ」を想定する中、
部屋の外から長いアームで上半身モジュールを投擲して吸盤とキャタピラで位置を調整し
バキューム式で紙をめくりXYプロッタ&ドットインパクト式にマークシートを埋めていく産業機械的ロボがやってくる未来が待ち遠しいです。
Re: (スコア:0)
>部屋の外から長いアームで上半身モジュールを投擲して
ロボコンに採用される未来まで見えた
Re:それってズルでは? (スコア:1)
> 二次試験で小論文とか出てきたらどうする
それについては、もう機械生成の実績があります [srad.jp]ね。
何が驚きって (スコア:1)
偏差値47.3ぐらいで、8割の大学でA判定が出ることがびっくり。
少子化の影響って凄まじいね。
Re:何が驚きって (スコア:1)
エェー
#座布団全部持って行ってgesaku
Re:何が驚きって (スコア:1)
林先生曰く「75以下は偏差値じゃない」そうで、そこから下は今の受験界だとどんぐり並みにどうでもいいみたい。
#こないだのマツコの知らない世界にて
Re: (スコア:0)
8割の大学ってどこかに書いてあります?
文系3科目(英・国・社?)に絞ると偏差値53ぐらいらしいので私立文系でだいぶ数を稼いでるみたいですね。
Re: (スコア:0)
他のニュースソースを見ればわかるけど、今回A判定が出た私立の数470は、判定が出る私立の8割らしいぞ。
天満 (スコア:0)
>200天満点中
英語の試験では神が降りたようだ、、なんて思った俺は、来年の春には偏差値抜かれてそう。
Re:天満 (スコア:1)
>900点万点中392点
900万点中392点は低すぎだろと思ったり思わなかったり
Re: (スコア:0)
公民とかは、全部1をマークと同じレベルですね。
Re: (スコア:0)
そういういみじゃない
よく見ろ
Re: (スコア:0)
そこまで低い点を出すのも難しいよな。
マークの塗り間違いでもしてりゃ別だけど。
Re: (スコア:0)
ウルトラマンのウで勝てる!
Re: (スコア:0)
いつのまにか問題数が 1マン倍になっていた件
Re: (スコア:0)
おいおい、東大のセンター足切りって550点前後じゃなかったか?
本試験に進めないじゃないかw
/.J編集者も (スコア:0)
人工知能だと思えば色々丸く収まるのかと夢想
頭は (スコア:0)
人並みなんですね。
よく出来てるなあ
ごはんを食べないとお腹がすくじゃないか (スコア:0)
指を折って数を数える機能もありそうですね。
常識がネック? (スコア:0)
レポート読むと、人、それも現代日本人、さらに言えば日本の受験生としての常識に欠ける、と思った。
「常識」ってよく使う言葉だが、厳密に表そうと思えば思うほど難しくなるんだろうな。
Re:常識がネック? (スコア:1)
「常識」って属する社会グループ層毎に異なるものですから。
受験専用人工知能界での「常識」とは是如何に。
一生懸命にやって、ロボット以下の人にはきつい結果だね (スコア:0)
俺は何のために生きているのだと、打ちのめされるのではないか。
Re:一生懸命にやって、ロボット以下の人にはきつい結果だね (スコア:1)
バイクより走るのが遅いマラソン選手とか、
フォークリフトより腕力のない重量挙げ選手とかいくらでもいるけど、
彼等が自殺したって話聞きます?
#かけ算じゃ、人間は電卓にもかなわない。
Re: (スコア:0)
バイクもフォークリフトも電卓も人間が使う側でいられたけど、
コンピュータが東大に受かるようになったら、
人間が使われる側になるだろうなぁと思うと、
自殺とまではいかないけど、複雑な心境。
Re: (スコア:0)
現時点では、コンピューターに命令されて動く会社とかは聞きませんし。
会社の業務をコンピューターがやってるのは省力化であって、コンピューターが判断してるわけではない。
そのうち、「コンピューターが勝手にやったんだ俺は命令してない」という被疑者に無罪判決(コンピューターが有罪)が出る時が来たら、考えることではないですか?
Re:一生懸命にやって、ロボット以下の人にはきつい結果だね (スコア:1)
コンピュータが解析した売上予測の分析に基づいて、人間であるマネージャーが計画を立てて
売上予測の予算差を突きつけられてその原因と対策を、人間である上司にレポートするあたりはほとんどの企業で
実現してると思います。これって十分にコンピュータによる命令ドリブンですよね?
---------------------------- うちの猫は、ながぬこ
Re: (スコア:0)
> 「コンピューターが勝手にやったんだ俺は命令してない」という被疑者に無罪判決(コンピューターが有罪)が出る時が来たら、
そのときは、以外に早く訪れそうな気がします。自動運転の自動車とか。
まあ、有罪になるのは自動車メーカーなのかな?
Re: (スコア:0)
一生懸命にやること自体は価値を何も生まないし、人間がやってロボット以下の仕事はロボットにやらせるべき。ロボットの方が人間より
上手にできることは、人間の人間性を測っていない。非人間的な行動がうまくできますよと言われてもしょうがないでしょ。
センター試験のテスト手法はよくないよね、という理解はあるのに、誰も改善しないで様式美を味わう日本だから成立することなのかもね。
その様式美で人生を左右される少年少女はたまったもんじゃないけどな。
# Amazonでは人間の方がロボットより安いから倉庫のピッキングにヒトが使われてるって言うよね
Re: (スコア:0)
そうでもない。ご褒美が貰えると分かってる作業をがんばれるかどうかという人間性を測れるし、
それは、便利にこき使いやすい人間かどうかという重要な指標になる(真に人間として優れてるかどうかとかいうような評価とは無関係に)。
Re: (スコア:0)
>センター試験のテスト手法はよくないよね、という理解はある
大学受験レベルまでは脳の基本性能を測る程度でしかないので、レギュレーションにあまりこだわっても仕方がない。
優秀な人間はレギュレーションの差異なんか気にしないか、対応してくるし。そういう対応能力がないいびつな人間は避けたい。
高度な人間的な作業を行うためには非人間的な作業をある程度行う能力が下敷きに必要。
Re: (スコア:0)
> 人間がやってロボット以下の仕事はロボットにやらせるべき。
問題は、そのうち人間の得意分野が無くなっちゃうかもしれないことだよね。
そうなると、価値観の転換に迫られるかもしれない。
社会の安定には、努力した人がそれに相応しい能力を身につけて報われることが重要だけど。
優れた人工知能は、製造法が分かってしまえば、努力せずともいくらでも量産できる。
あなたの言う、努力自身は無価値な社会が到来する。
Re: (スコア:0)
そんなでもないだろ。
コンピューターの読解力が試される試験であって、
記憶力はデータベースから持ってきてるんだろこれ。
人間と同じ土俵じゃねえ。
Re: (スコア:0)
はて。
センター試験は、人間の脳からデータベース機能をはずす規則でもありましたっけ。
Re: (スコア:0)
その理屈だと、チェスや将棋の棋士は生きる価値がないな。
Re: (スコア:0)
そもそもチェスや将棋なんて何のために・・・
Re: (スコア:0)
CPU対戦に負けて自殺するやつなんているのかね
Re: (スコア:0)
点数なんて問題じゃない、評価の対象は如何に自分では価値が認められないことにでも集中して努力できるかだ、
と昔入った会社の人事担当者が言っていた。
思ったほど盛り上がってない? (スコア:0)
もっと、我も我もといろんな人がチャレンジして点数を競い合うような企画なんだと思ってたけど、
割と身内で頑張ったり、別の分野の研究者を身内に引き込んだりするようなこぢんまりとした話なのか。
この部分は○○の専門家を連れてこなきゃ解決しない、と言ってるんじゃなくて、
その分野の人らがこぞって参加してくるようなイベントに育って欲しいなぁ。
Re: (スコア:0)
物量を投入しさえすれば勝てるのはIBMがすでに証明したのであとはレギュレーションだけの問題だろ。
つまんねぇじゃん。
Re: (スコア:0)
「入試」自体がレギュレーションとしてアバウトすぎるから、
強くなった/弱くなったというのが分かり難くて、ターゲットとして面白くないんじゃね。
「去年の問題は今年より簡単だった」とか、「今年から出題形式が変わった」みたいな話も多いし。
数年ごとにチェスや将棋のルールが変わってたら、
「この20年でチェス/将棋プログラムがこれだけ強くなった」
という話は出来ないと思う。
それに自然言語理解や機械翻訳と違って実用的価値も少ないし。
だから研究課題としては非常につまらんと思う。
#せいぜいクイズ王選手権レベル。与太話にはなるが、競技にはならん。
Re: (スコア:0)
ポイントは話題性ですね。
予算をとるには、こういう風に新聞に載るというのは有利なのです。
マスコミが本質的な有用性を捉えられないと舐められているということでもあります。
時間は? (スコア:0)
センター試験は時間をかければ問題が解けるのは当たり前で、時間との勝負だと教えられましたし、過去問を解くときに時間を計っていないと怒られました。几帳面な人は自分の疲労度も考えて、本番と同じ順番同じ時間帯で過去問をやっている人もいましたが、どうなってるんでしょうか。
Re: (スコア:0)
どうせコンピューターの処理能力なんて予算さえあれば無制限に上げられるものだし、難関国公立受ける人は満点近く要求されるから時間余るのが普通だし。