「大学入学試験合格」を目指す人工知能、偏差値47.3を達成

「大学入学試験合格」を目指す人工知能、偏差値47.3を達成 49

ストーリー by hylom 2014年11月04日 19時05分
AIはいつ人間を超えるか部門より

insiderman 曰く、

東京大学の入学試験に合格することを目指す工知能開発プロジェクト「ロボットは東大に入れるか」の成果報告会が行われた（NHKニュース、ロボットは東大に入れるか」成果報告会 in 2014（11/2）レポート）。
センター試験の結果は900点万点中392点で、偏差値としては47.3に相当するという。また、文系3科目に絞った場合の偏差値は53.4となるそうだ。
具体的な点数については、数学が95点（200点満点中）、物理は31点（100点満点中）、英語が95点（200天満点中）、現代文が58点、世界史Bが52点、日本史が44点、政経が17点（それぞれ100点満点中）。
点数も興味深いが、それ以上に解法についての解説が面白い。こういった試験問題を人工知能が解くためには、問題文を人工知能が解析しやすい形に変換する必要があり、科目ごとにそれぞれ特化したアプローチを使っているという。

この議論は賞味期限が切れたので、アーカイブ化されています。新たにコメントを付けることはできません。

記事ページを表示すべてのコメント取得

検索49コメント Log In/Create an Account

それってズルでは？ (スコア:3)

by saitoh (10803) on 2014年11月04日 19時37分 (#2705965)

問題文を人工知能が解析しやすい形に変換してるってのなら、人工知能が入試問題を解けましたと言ってはいけないと思うな。
- Re:それってズルでは？ (スコア:1)
  
  by Anonymous Coward on 2014年11月04日 19時51分 (#2705974)
  
  数学の問題とか図がある場合はズルっぽいですね。
  人間が図の構造を代わりに理解してやってるようだし。
  でも、文章問題は人間は xml に変換するくらいしかやってないとするなら、
  まあ、その程度は良いんじゃないですか？
  
  シェア
  
  親コメント
  - Re:それってズルでは？ (スコア:3)
    
    by saitoh (10803) on 2014年11月05日 7時10分 (#2706223)
    
    XMLといってもどこまで構文解析してあるかによってズルかどうかは変わりますね。というのも、人間の受験生も問題の意味の取り違えとか回答枠の勘違いなどで失点することは多々あるので。
    
    シェア
    
    親コメント
- Re: (スコア:0)
  
  by Anonymous Coward
  
  そのうち将棋みたいに勝ち越されて擁護する奴がでてくるんじゃね？
- Re: (スコア:0)
  
  by Anonymous Coward
  
  次にお前は「試験場に自分で来て、机に向かってエンピツと消しゴムで答案を書かなければ自力で解いたとは認めない」と言い出すッ！
- Re: (スコア:0)
  
  by Anonymous Coward
  
  なんだ、がっしゃんがっしゃんと歩いて試験場に入ってきて席に着き、
  答案用紙や問題が前からまわってきたら自分の分を取って後ろに回して、
  開始の掛け声と共に、ページをめくって問題を読んで、
  鉛筆握ってマークシートに記入するようなのを想像していたのに、違うのか。
  上げ膳据え膳付きの、中国語の部屋なのね。
  二次試験で小論文とか出てきたらどうするつもりなんだろう。
  - Re:それってズルでは？ (スコア:1)
    
    by digoh (17917) on 2014年11月05日 10時54分 (#2706333) 日記
    
    誰もが「二足歩行で歩いて手で椅子を引いて座り鉛筆を手に持って筆記するヒト型ロボ」を想定する中、
    部屋の外から長いアームで上半身モジュールを投擲して吸盤とキャタピラで位置を調整し
    バキューム式で紙をめくりXYプロッタ＆ドットインパクト式にマークシートを埋めていく産業機械的ロボがやってくる未来が待ち遠しいです。
    
    シェア
    
    親コメント
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      >部屋の外から長いアームで上半身モジュールを投擲して
      ロボコンに採用される未来まで見えた
  - Re:それってズルでは？ (スコア:1)
    
    by taka2 (14791) on 2014年11月05日 11時30分 (#2706351) ホームページ日記
    
    > 二次試験で小論文とか出てきたらどうする
    それについては、もう機械生成の実績があります [srad.jp]ね。
    
    シェア
    
    親コメント
何が驚きって (スコア:1)

by Anonymous Coward on 2014年11月04日 20時10分 (#2705993)

偏差値47.3ぐらいで、8割の大学でA判定が出ることがびっくり。
少子化の影響って凄まじいね。
- Re:何が驚きって (スコア:1)
  
  by gesaku (7381) on 2014年11月04日 20時41分 (#2706012)
  
  エェー
  ＃座布団全部持って行ってgesaku
  
  シェア
  
  親コメント
- Re:何が驚きって (スコア:1)
  
  by nemui4 (20313) on 2014年11月05日 10時06分 (#2706301) 日記
  
  林先生曰く「75以下は偏差値じゃない」そうで、そこから下は今の受験界だとどんぐり並みにどうでもいいみたい。
  #こないだのマツコの知らない世界にて
  
  シェア
  
  親コメント
- Re: (スコア:0)
  
  by Anonymous Coward
  
  8割の大学ってどこかに書いてあります？
  文系3科目（英・国・社？）に絞ると偏差値53ぐらいらしいので私立文系でだいぶ数を稼いでるみたいですね。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    他のニュースソースを見ればわかるけど、今回A判定が出た私立の数470は、判定が出る私立の8割らしいぞ。
天満 (スコア:0)

by Anonymous Coward on 2014年11月04日 19時14分 (#2705941)

>200天満点中
英語の試験では神が降りたようだ、、なんて思った俺は、来年の春には偏差値抜かれてそう。
- Re:天満 (スコア:1)
  
  by Anonymous Coward on 2014年11月04日 19時17分 (#2705946)
  
  ＞900点万点中392点
  900万点中392点は低すぎだろと思ったり思わなかったり
  
  シェア
  
  親コメント
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    公民とかは、全部1をマークと同じレベルですね。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      そういういみじゃない
      よく見ろ
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        そこまで低い点を出すのも難しいよな。
        マークの塗り間違いでもしてりゃ別だけど。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      ウルトラマンのウで勝てる！
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    いつのまにか問題数が 1マン倍になっていた件
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    おいおい、東大のセンター足切りって550点前後じゃなかったか？
    本試験に進めないじゃないかw
/.J編集者も (スコア:0)

by Anonymous Coward on 2014年11月04日 19時21分 (#2705949)

人工知能だと思えば色々丸く収まるのかと夢想
頭は (スコア:0)

by Anonymous Coward on 2014年11月04日 20時36分 (#2706007)

人並みなんですね。
よく出来てるなあ
- ごはんを食べないとお腹がすくじゃないか (スコア:0)
  
  by Anonymous Coward
  
  指を折って数を数える機能もありそうですね。
常識がネック？ (スコア:0)

by Anonymous Coward on 2014年11月04日 21時02分 (#2706028)

レポート読むと、人、それも現代日本人、さらに言えば日本の受験生としての常識に欠ける、と思った。
「常識」ってよく使う言葉だが、厳密に表そうと思えば思うほど難しくなるんだろうな。
- Re:常識がネック？ (スコア:1)
  
  by nemui4 (20313) on 2014年11月05日 10時07分 (#2706305) 日記
  
  「常識」って属する社会グループ層毎に異なるものですから。
  受験専用人工知能界での「常識」とは是如何に。
  
  シェア
  
  親コメント
一生懸命にやって、ロボット以下の人にはきつい結果だね (スコア:0)

by Anonymous Coward on 2014年11月04日 21時15分 (#2706036)

俺は何のために生きているのだと、打ちのめされるのではないか。
- Re:一生懸命にやって、ロボット以下の人にはきつい結果だね (スコア:1)
  
  by firewheel (31280) on 2014年11月05日 8時16分 (#2706238)
  
  バイクより走るのが遅いマラソン選手とか、
  フォークリフトより腕力のない重量挙げ選手とかいくらでもいるけど、
  彼等が自殺したって話聞きます？
  ＃かけ算じゃ、人間は電卓にもかなわない。
  
  シェア
  
  親コメント
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    バイクもフォークリフトも電卓も人間が使う側でいられたけど、
    コンピュータが東大に受かるようになったら、
    人間が使われる側になるだろうなぁと思うと、
    自殺とまではいかないけど、複雑な心境。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      現時点では、コンピューターに命令されて動く会社とかは聞きませんし。
      会社の業務をコンピューターがやってるのは省力化であって、コンピューターが判断してるわけではない。
      そのうち、「コンピューターが勝手にやったんだ俺は命令してない」という被疑者に無罪判決（コンピューターが有罪）が出る時が来たら、考えることではないですか？
      - Re:一生懸命にやって、ロボット以下の人にはきつい結果だね (スコア:1)
        
        by inouek (31502) on 2014年11月05日 14時00分 (#2706445)
        
        コンピュータが解析した売上予測の分析に基づいて、人間であるマネージャーが計画を立てて
        売上予測の予算差を突きつけられてその原因と対策を、人間である上司にレポートするあたりはほとんどの企業で
        実現してると思います。これって十分にコンピュータによる命令ドリブンですよね？
        
        --
        ---------------------------- うちの猫は、ながぬこ
        
        シェア
        
        親コメント
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        > 「コンピューターが勝手にやったんだ俺は命令してない」という被疑者に無罪判決（コンピューターが有罪）が出る時が来たら、
        そのときは、以外に早く訪れそうな気がします。自動運転の自動車とか。
        まあ、有罪になるのは自動車メーカーなのかな？
- Re: (スコア:0)
  
  by Anonymous Coward
  
  一生懸命にやること自体は価値を何も生まないし、人間がやってロボット以下の仕事はロボットにやらせるべき。ロボットの方が人間より
  上手にできることは、人間の人間性を測っていない。非人間的な行動がうまくできますよと言われてもしょうがないでしょ。
  センター試験のテスト手法はよくないよね、という理解はあるのに、誰も改善しないで様式美を味わう日本だから成立することなのかもね。
  その様式美で人生を左右される少年少女はたまったもんじゃないけどな。
  # Amazonでは人間の方がロボットより安いから倉庫のピッキングにヒトが使われてるって言うよね
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    そうでもない。ご褒美が貰えると分かってる作業をがんばれるかどうかという人間性を測れるし、
    それは、便利にこき使いやすい人間かどうかという重要な指標になる(真に人間として優れてるかどうかとかいうような評価とは無関係に)。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    >センター試験のテスト手法はよくないよね、という理解はある
    大学受験レベルまでは脳の基本性能を測る程度でしかないので、レギュレーションにあまりこだわっても仕方がない。
    優秀な人間はレギュレーションの差異なんか気にしないか、対応してくるし。そういう対応能力がないいびつな人間は避けたい。
    高度な人間的な作業を行うためには非人間的な作業をある程度行う能力が下敷きに必要。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    > 人間がやってロボット以下の仕事はロボットにやらせるべき。
    問題は、そのうち人間の得意分野が無くなっちゃうかもしれないことだよね。
    そうなると、価値観の転換に迫られるかもしれない。
    社会の安定には、努力した人がそれに相応しい能力を身につけて報われることが重要だけど。
    優れた人工知能は、製造法が分かってしまえば、努力せずともいくらでも量産できる。
    あなたの言う、努力自身は無価値な社会が到来する。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  そんなでもないだろ。
  コンピューターの読解力が試される試験であって、
  記憶力はデータベースから持ってきてるんだろこれ。
  人間と同じ土俵じゃねえ。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    はて。
    センター試験は、人間の脳からデータベース機能をはずす規則でもありましたっけ。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  その理屈だと、チェスや将棋の棋士は生きる価値がないな。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    そもそもチェスや将棋なんて何のために・・・
- Re: (スコア:0)
  
  by Anonymous Coward
  
  CPU対戦に負けて自殺するやつなんているのかね
- Re: (スコア:0)
  
  by Anonymous Coward
  
  点数なんて問題じゃない、評価の対象は如何に自分では価値が認められないことにでも集中して努力できるかだ、
  と昔入った会社の人事担当者が言っていた。
思ったほど盛り上がってない? (スコア:0)

by Anonymous Coward on 2014年11月04日 21時46分 (#2706054)

もっと、我も我もといろんな人がチャレンジして点数を競い合うような企画なんだと思ってたけど、
割と身内で頑張ったり、別の分野の研究者を身内に引き込んだりするようなこぢんまりとした話なのか。
この部分は○○の専門家を連れてこなきゃ解決しない、と言ってるんじゃなくて、
その分野の人らがこぞって参加してくるようなイベントに育って欲しいなぁ。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  物量を投入しさえすれば勝てるのはIBMがすでに証明したのであとはレギュレーションだけの問題だろ。
  つまんねぇじゃん。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  「入試」自体がレギュレーションとしてアバウトすぎるから、
  強くなった／弱くなったというのが分かり難くて、ターゲットとして面白くないんじゃね。
  「去年の問題は今年より簡単だった」とか、「今年から出題形式が変わった」みたいな話も多いし。
  数年ごとにチェスや将棋のルールが変わってたら、
  「この20年でチェス／将棋プログラムがこれだけ強くなった」
  という話は出来ないと思う。
  それに自然言語理解や機械翻訳と違って実用的価値も少ないし。
  だから研究課題としては非常につまらんと思う。
  ＃せいぜいクイズ王選手権レベル。与太話にはなるが、競技にはならん。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    ポイントは話題性ですね。
    予算をとるには、こういう風に新聞に載るというのは有利なのです。
    マスコミが本質的な有用性を捉えられないと舐められているということでもあります。
時間は？ (スコア:0)

by Anonymous Coward on 2014年11月05日 11時51分 (#2706362)

センター試験は時間をかければ問題が解けるのは当たり前で、時間との勝負だと教えられましたし、過去問を解くときに時間を計っていないと怒られました。几帳面な人は自分の疲労度も考えて、本番と同じ順番同じ時間帯で過去問をやっている人もいましたが、どうなってるんでしょうか。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  リンク先のレポートにあるように、それぞれの小問ごとに制限時間いっぱいに使うプログラムを並列動作させたとか。
  どうせコンピューターの処理能力なんて予算さえあれば無制限に上げられるものだし、難関国公立受ける人は満点近く要求されるから時間余るのが普通だし。

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

それってズルでは？ (スコア:3)

Re:それってズルでは？ (スコア:1)

Re:それってズルでは？ (スコア:3)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re:それってズルでは？ (スコア:1)

Re: (スコア:0)

Re:それってズルでは？ (スコア:1)

何が驚きって (スコア:1)

Re:何が驚きって (スコア:1)

Re:何が驚きって (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

天満 (スコア:0)

Re:天満 (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

/.J編集者も (スコア:0)

頭は (スコア:0)

ごはんを食べないとお腹がすくじゃないか (スコア:0)

常識がネック？ (スコア:0)

Re:常識がネック？ (スコア:1)

一生懸命にやって、ロボット以下の人にはきつい結果だね (スコア:0)

Re:一生懸命にやって、ロボット以下の人にはきつい結果だね (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re:一生懸命にやって、ロボット以下の人にはきつい結果だね (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

思ったほど盛り上がってない? (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

時間は？ (スコア:0)

Re: (スコア:0)