Research

Research

by nicoxz

共通テストでOpenAIが9科目満点達成、得点率97%の衝撃

by nicoxz
URLをコピーしました

はじめに

2026年1月17日・18日に実施された大学入学共通テストにおいて、人工知能(AI)が驚異的な成績を記録しました。AIスタートアップのライフプロンプト(東京・新宿)と日本経済新聞が共同で調査した結果、米OpenAIのChatGPT最新モデル(GPT-5.2)が主要15科目のうち9科目で満点を獲得し、全体の得点率は97%に達しました。

満点科目が出たのは調査開始以来初めてのことです。米Googleや米Anthropicのモデルも91%の得点率を記録しましたが、OpenAIが圧倒的な差をつける形となりました。本記事では、AI各社の成績比較、AIの学力向上の背景、そして社会への影響について詳しく解説します。

AI各社の共通テスト成績比較

OpenAI(GPT-5.2)の圧勝

2026年の共通テストでは、OpenAIのGPT-5.2 Thinkingモデルが文系・理系ともに圧勝しました。満点を獲得した科目には「数学1A」「数学2BC」「化学」「公共、政治・経済」「情報1」などが含まれています。

特筆すべきは、文系で国内最難関とされる東大文科1類の受験生が選択する科目に絞っても、得点率が97%という高水準を維持したことです。大手予備校の河合塾が予想した東大文科1類の合格ボーダーライン(89%)を大きく上回っており、AIが難関大学の入学レベルを完全に超えたことが示されました。

Google・Anthropicとの比較

GoogleのGemini 3とAnthropicのClaudeは、ともに得点率91%を記録しました。OpenAIとの差は6ポイントですが、この差は決して小さくありません。

回答時間においては明確な違いが見られました。GeminiとClaudeが1時間40分前後で試験時間10時間10分の約6分の1という速度で完走したのに対し、GPT-5.2は約5時間30分を要しました。GPT-5.2は「高得点だが遅い(熟考型)」、Gemini・Claudeは「爆速でそこそこ高得点(即答型)」という特性が浮き彫りになりました。

日本史満点の技術的背景

特に注目すべきは、日本史での満点達成です。これは単なる技術的ブレイクスルーというよりも、学習量の成果といえます。

昨年までは英語圏のデータが主体で日本のマニアックな歴史に疎かったAIですが、この1年で日本語のテキストデータを大量に学習しました。また、単語の暗記だけでなく、歴史の因果関係(コンテキスト)を深く理解するようになったことで、資料読解問題でも文脈から正解を導き出せるようになったのです。

AIの学力向上の軌跡

4年間の劇的な進化

ライフプロンプトは2023年から毎年AIに共通テストを解かせる調査を実施しています。東大文科1類科目における得点率の推移を見ると、2024年は66%、2025年は91%、そして2026年は97%と、急速な向上が見られます。

2025年には、OpenAIのo1モデルが東大2次試験の文系入試で合格最低点を約40〜50点上回り合格。さらに理科三類でも合格最低点を超えるスコアを獲得しており、AIが日本の最難関大学に「合格」できるレベルに到達したことが確認されていました。

GPT-5シリーズの技術的特徴

2025年8月に正式リリースされたGPT-5は、OpenAIが「これまでで最も優れたAIシステム」と位置づけるモデルです。効率的なモデルで大半の質問に回答し、より難しい問題には深い推論モデル(GPT-5 thinking)を使用する統合システムを採用しています。

GPT-5はコーディングとエージェントタスクに最適化されており、複雑なフロントエンド生成や大規模リポジトリのデバッグで特に改善が見られます。ハルシネーション(事実と異なる回答)もGPT-4oと比べて約20%減少し、thinkingモードではo3と比べて約70%も減少しています。

2025年12月にはGPT-5.2が発表され、全般的な知能、長文脈理解、エージェント的ツール呼び出し、視覚において大幅な改善がもたらされました。GDPvalベンチマークでは、44の職業にわたる知識業務タスクで、業界トップの専門家の70.9%を上回るか同等の評価を獲得しています。

社会への影響と課題

デスクワークへの影響

今回の結果は、AIが難関大学入学レベルの知能を備え、幅広いデスクワークを担える能力を改めて示しました。野村総合研究所とオックスフォード大学の共同研究によると、10〜20年後には日本の労働人口の約49%が就いている仕事がAIに代替可能と推測されています。

特に影響を受けるのは単純なデスクワークです。一般事務員が行う書類作成や計算業務、銀行の窓口業務、コールセンター業務などは、AIによる代替の可能性が高いとされています。

若者の雇用への懸念

ニューヨーク連邦準備銀行の最新分析によれば、新卒大学生の失業率は5.8%に達し、失業率全体との差が2024年と比べてさらに開いています。LinkedInのチーフ経済機会責任者は「キャリアのはしごの下段が壊れつつある」と表現しており、若者の労働参加率低下や格差拡大が懸念されています。

日経新聞の調査では、4割の学生がAIの影響を見越して志望職種や業界を変更しており、6割超の学生が「雇用は減少する」と回答しています。

教育システムへの問い

AIが共通テストで9科目満点を取れる時代に、従来の知識詰め込み型教育の意義が問われています。創造性、感情的知性、複雑な問題解決能力、リーダーシップ、技術的適応力など、AIには代替しにくいスキルの育成がより重要になってきます。

注意点・今後の展望

ビジネスでの活用指針

今回の検証結果は、ビジネスでのAI活用にも示唆を与えています。財務・法務・数値レポートなど絶対にミスが許されない業務には、時間がかかってもGPT-5.2のような高精度モデルを選ぶべきです。一方、議事録要約・カスタマーサポート・アイデア出しなどスピードや処理量が求められる業務には、GeminiやClaudeの方が効率的といえます。

変化への対応が鍵

AIの普及による雇用変化の影響が大きいのは、変化を前提とした教育を受けて育つ子どもたちよりも、従来の教育を受けた社会人です。すでにプログラミングが学校教育に導入されている世代とは異なり、これまでの制度や仕組みで教育・雇用されてきた人々が急に生き方を変えるには困難が伴います。

将来増える仕事

一方で、AIの発展によって増える仕事もあります。「需要を生み出す」仕事、つまり観光業をはじめとするサービス業や、新たなニーズを掘り起こし具現化するような創造的な仕事は今後増えていくと予測されています。AIを活用しながら、人にしかできない価値を提供することが、これからの時代を生き抜く鍵となります。

まとめ

2026年大学入学共通テストにおけるAIの成績は、人工知能の能力が新たな段階に到達したことを示しています。OpenAIのGPT-5.2が9科目満点、得点率97%を達成し、Google・Anthropicに6ポイントの差をつけました。

この結果は、AIが幅広いデスクワークを担える能力を備えていることを改めて証明するものです。教育のあり方、労働市場の構造、個人のキャリア設計など、社会の様々な側面で変革が求められる時代に入ったといえます。AIの能力向上に目を奪われるだけでなく、人間にしかできない価値創造に注力することが、これからの社会で重要になってきます。

参考資料:

関連記事

最新ニュース