AIが共通テスト9科目満点達成、OpenAIが得点率97%でトップに
はじめに
2026年1月17〜18日に実施された大学入学共通テストに、最新の人工知能(AI)が挑戦しました。その結果、米OpenAIの「ChatGPT」最新モデルは主要15科目のうち9科目で満点を獲得し、得点率97%を達成しました。米Googleや米Anthropicのモデル(ともに91%)を大きく上回る結果です。
この調査はAIスタートアップのライフプロンプト(東京・新宿)との共同で行われました。AIが難関大学入学レベルの知能を備え、幅広い事務作業を担える能力を改めて示したと評価されています。
本記事では、共通テストにおけるAI各社の詳細な成績と、この結果が示す社会への影響について解説します。
共通テストでのAI各社の成績比較
OpenAIが圧倒的な成績を記録
今回の検証には「ChatGPT」「Gemini」「Claude」という3つの主要大規模言語モデル(LLM)が投入されました。中でもOpenAIの最新モデル「GPT-5.2 Thinking」が、9科目において満点を記録する驚異的な結果を残しています。
満点を獲得した科目は「数学1A」「数学2BC」「公共、政治・経済」「化学」「物理基礎」「化学基礎」「地学基礎」「生物基礎」「情報1」の9科目です。いずれも論理的思考や計算能力が重視される科目であり、AIの得意分野と言えます。
総合得点での比較
実際の受験生の選択科目に合わせた総合結果では、ChatGPTが文系970点、理系968点(いずれも1000点満点)を獲得しました。これは東京大学文科一類の合格者平均を大きく上回る水準です。
15科目平均の得点率では以下のような結果となりました。
- OpenAI(GPT-5.2 Thinking): 96.9%
- Google(Gemini 3.0 Pro): 91.4%
- Anthropic(Claude 4.5 Opus): 90.9%
GeminiとClaudeは900点前半で競り合う結果となり、OpenAIとの差は約6ポイントという明確な開きが生じています。
過去からの急速な進化
ライフプロンプトは2024年から毎年、AIに共通テストを解かせる検証を行っています。東京大学文科1類の受験生が多く選ぶ科目に絞った得点率の推移を見ると、その進化の速さが一目瞭然です。
- 2024年: 66%
- 2025年: 91%
- 2026年: 97%
わずか2年で得点率は31ポイントも向上しています。図の認識や文脈の情報処理能力など、AIの基礎性能が急速に高まっていることがこの結果の背景にあります。
主要AIモデルの特徴と違い
GPT-5.2(OpenAI)の強み
GPT-5.2はOpenAIのフラッグシップモデルとして、複雑な推論や数学的問題で優れた性能を発揮します。100万トークンのコンテキストウィンドウに対応し、GPT-4o比で20%のコスト削減も実現しています。
総合力の高さが特徴で、手順推論(ステップバイステップの問題解決)において特に優れています。共通テストで9科目満点という結果は、この総合力の証明と言えるでしょう。
Claude 4.5 Opus(Anthropic)の特徴
AnthropicのClaude Opus 4.5は、特にコーディングタスクで競合を上回る性能を発揮し、開発者から高い支持を得ています。エージェントタスクのベンチマーク(SWE-Bench)では80.9%という最高性能を達成しています。
また、クリエイティブライティングでより自然で人間らしい文体を生成する点も評価されています。共通テストでは得点率90.9%と、特定科目では高い正答率を示しました。
Gemini 3.0 Pro(Google)の強み
GoogleのGemini 3.0 Proは、マルチモーダルタスク(画像・動画・ドキュメントの統合分析)に強みを持ちます。150万トークンという最大級のコンテキストウィンドウを持ち、大規模なコードベースや長文ドキュメントを扱う場合に最適です。
Google Workspaceとの統合がシームレスで、Gmail、Google Docs、Sheets、Slides、Driveとネイティブに連携できる点もビジネス利用において大きなメリットとなっています。
AIの知的能力向上が示す社会への影響
事務作業の自動化加速
AIが難関大学入試レベルの問題を解けるようになったことは、多くの知的労働がAIで代替可能になりつつあることを意味します。
一般事務やデータ入力など、定型的な作業はAIやRPA(ロボティック・プロセス・オートメーション)の導入が加速しています。これらの業務はルールが明確で手順が固定化されているため、自動化に非常に適しているためです。
調査会社Deloitteは2026年を「シリコンベースの労働力(Silicon-based workforce)」の登場と表現しています。企業は人間だけではなく、「デジタル従業員」としてのAIエージェントを含むハイブリッドな労働力を管理する必要に迫られています。
日本の労働市場への影響
少子高齢化により、日本では2040年に1,100万人の労働力不足が予測されています。みずほリサーチ&テクノロジーズの調査では、2025年に6,149万人いる労働者が、2065年には3,946万人まで減少する見通しです。
こうした中、AIは分析から予測、最適化、実行までを一気通貫で担い、労働力不足という日本特有の社会課題に対する解決策として期待されています。国内企業がAIを積極的に導入することで、2025年までには最大34兆円の経済効果が予測されており、一人当たりの生産性は540万円から610万円の改善につながると試算されています。
教育への影響と入試の変化
AIが大学入試を突破できるレベルに達したことで、教育のあり方にも見直しが求められています。
2025年度東京大学2次試験では、OpenAIのo1モデルが文系入試の合格最低点を約40〜50点の差で上回り、理科三類でも合格レベルに到達しました。ただし、細かなイラストの違いを読み取る問題や空間図形を想像し作図する問題では依然としてミスが見られ、AIの弱点も明らかになっています。
こうした状況を受け、大学入学共通テストは2025年から6教科30科目から7教科21科目に再編され、新教科「情報Ⅰ」が加わりました。知識だけでは解けない問題の出題が増え、思考力や人間力を評価する方向へのシフトが進んでいます。
今後の展望と注意点
2026年はAI活用の分岐点
2026年は「AIで稼ぐ企業」と「AIがコストであり続ける企業」がはっきり分かれる年になると予測されています。AI市場の規模は2025年の2,440億ドルから2026年には3,120億ドルへと成長し、2030年には8,270億ドルに達する見通しです。
企業には、社内の全職務をタスクレベルで分解し、どの業務が「代替」可能で、どの業務が「補完」によって価値を高められるかを可視化する「タスク・デューデリジェンス」の実施が求められています。
人間に求められるスキルの変化
AIが定型的な知識処理で人間を上回る時代において、人間に求められるのは創造性、感情的知性、複雑な対人関係の構築といった能力です。
推薦入試においても「自分の体験と学びがどうつながっているか」という一貫性が重視されるようになっており、単なる知識量ではなく「人間らしさ」を問う傾向が強まっています。
まとめ
2026年大学入学共通テストでOpenAIのChatGPT最新モデルが9科目満点、得点率97%を達成しました。これはGoogleやAnthropicのモデルを約6ポイント上回る結果であり、AIの知的能力が急速に向上していることを示しています。
この結果は、単なる技術的達成にとどまらず、労働市場と教育に大きな影響を与えることを示唆しています。定型的な事務作業の自動化が加速する一方、人間には創造性や対人スキルといった「AIにできないこと」がより強く求められるようになるでしょう。
企業も個人も、AIとの協働を前提とした新しいスキルセットの獲得が急務となっています。
参考資料:
関連記事
OpenAIがIPO前倒しへ、AI業界の上場競争が加速
OpenAIが2026年第4四半期のIPOに向けた準備を開始。Anthropicとの上場競争や1兆ドル評価額の背景、投資家が注目すべきポイントを解説します。
共通テストで9科目満点、AIが難関大入学レベルの学力を実証
2026年大学入学共通テストにAIが挑戦し、OpenAIの最新モデルが9科目で満点、全体得点率97%を達成。GoogleやAnthropicを上回る結果から、AIの能力向上と社会への影響を解説します。
共通テストでOpenAIが9科目満点達成、得点率97%の衝撃
2026年大学入学共通テストで、OpenAIのChatGPTが9科目満点、得点率97%を達成しました。Google、Anthropicとの比較結果や、AIの学力向上が社会に与える影響を解説します。
ソフトバンクG株価低迷の背景、AI競争とアーム株が重荷に
ソフトバンクグループの株価が2026年1月に入り低迷しています。GoogleのGemini躍進、傘下アームの業績不透明感、信用取引の動向という3つの逆風を解説します。
SaaS株急落、AIエージェントが業務ソフトを脅かす構図とは
Anthropicの新技術公開をきっかけに米SaaS関連株が急落しました。AIによる「SaaSの死」という市場の警戒と、実際の業界動向を解説します。
最新ニュース
ビットコイン7万ドル台急落、テック株売りが暗号資産に波及
ビットコインが約1年3カ月ぶりの安値となる7万2000ドル台に急落しました。米ハイテク株の売りが暗号資産市場に波及した背景と、MicroStrategyの含み損問題について解説します。
日銀の量的引き締め出遅れと円安の関係を解説
日銀のマネタリーベース縮小が米欧に比べ緩やかな理由と、それが円安に与える影響について解説します。FRB新議長候補ウォーシュ氏の金融政策姿勢にも注目が集まっています。
書店600店の在庫を一元化|返品率30ポイント削減の新システム
紀伊国屋書店、TSUTAYA、日販が出資するブックセラーズ&カンパニーが、56社603店の在庫を横断管理するデータベースを始動。返品率6割減を実現した事例と、出版業界の構造改革を解説します。
中国海警局の尖閣周辺活動が過去最多に、日中の緊張続く
2025年、中国海警局の船舶が尖閣諸島周辺の接続水域に357日出没し過去最多を更新。日本の対応策と偶発的衝突防止の課題を解説します。
中国の土地売却収入がピーク比半減、地方財政に深刻な打撃
中国の地方政府の土地売却収入が2025年も前年比14.7%減少し4年連続の減少を記録。ピークの2021年から52%減となり、不動産不況が地方財政を圧迫し続けています。