スタンフォード大学の423ページに及ぶAIレポートによると、中国と米国の差はわずか2.7%であり、清華大学のDeepSeekは世界のトップ10入りを果たした。

著者：新志遠

編集者：Sleepy Peach

【最新情報】スタンフォード大学の「2026年AIインデックスレポート」が発表されました！432ページに及ぶこのレポートは非常に貴重な内容です。AI分野における中国と米国の差はほぼ縮まり、わずか2.7%にまで縮小しました。世界トップクラスのAI人材は年間95人輩出され、主に大手テクノロジー企業に集中しています。最も注目すべきは、22歳から25歳の開発者の雇用が20%減少したことです。

本日、スタンフォード大学HAIは「2026年AIインデックスレポート」を発表しました！

この423ページに及ぶ年次報告書は、世界のAI業界における最新の勢力図を包括的に明らかにしている。

結論として、AIの能力は急速に向上しているものの、それを測定し管理する人類の能力はそれに追いついていない、ということが挙げられます。

最も衝撃的な結論は――

中国とアメリカのAIモデルの性能差はほぼ解消され、両国は激しい競争の中で頻繁に優劣を争っている。現在、Anthropicのリードはわずか2.7%に過ぎない。

米国はAIに他国よりも多くの資金を投じているが、優秀な人材の確保がますます困難になっている。

同報告書はまた、AIの進化は、いわゆる「ボトルネック」に遭遇することなく、むしろ前例のない速度で加速していると指摘している。

過去1年間で、世界のトップモデルの90%以上が、博士課程レベルの科学的問題、マルチモーダル推論、競技数学において、人間のパフォーマンスに匹敵するか、あるいはそれを凌駕する成果を上げている。

特にコーディング能力の面では、SWE-benchのスコアは1年以内に60%からほぼ100%に急上昇した。

しかし、AIは極めて深刻な「不均衡」なアプローチを示し、歪んだ現実を提示する。

LLMは国際モーターショーで金メダルを獲得できるほどの性能を持っているが、アナログ時計を正確に読み取ることができず、その精度はわずか50.1%に過ぎない。

一方、AIが雇用を奪うという予測は現実のものとなり、最初にその影響を受けるのは今日の若い「労働者階級」である。

これが本題です。「2026年AIインデックスレポート」で注目すべき12の主要トレンドをご紹介します。

その他の注目ポイント（概要）：

世界のAIコンピューティング能力は3年間で30倍に増加し、Nvidiaが市場シェアの60%を占め、チップのほぼすべてがTSMCによって製造されている。
世界の企業によるAI投資額は、2025年までに5817億ドルに達すると予測されており、これは前年比で倍増以上となる見込みで、そのうち米国がほぼ半分を占める。
米国に入国するAI研究者の数は、過去7年間で89%減少しており、特に過去1年間では80%減少している。
2024年以降、22歳から25歳のソフトウェア開発者の雇用は20%減少しており、特にエントリーレベルの職種が削減の対象となっている。
中国は合計85台の公共AIスーパーコンピューターを構築しており、これは北米の2倍以上で、世界第1位となっている。
中国の職場におけるAIの利用率は80％を超え、世界平均の58％を大きく上回っている。
最も強力なモデルはますます不透明になってきており、代表的な95モデルのうち80モデルは、一般に公開されている学習コードを持っていません。

中国と米国の地理的な近さの差は、わずか2.7%にまで縮小した。

スタンフォード大学は、2023年5月以降のArenaランキングにおける米国と中国のトッププレイヤーを、同じ座標系上にプロットした。

2023年5月時点で、GPT-4-0314が1320ポイントで首位に立っており、中国は依然としてchatglm-6bにとどまっており、その差は300ポイント以上だった。

2025年2月、DeepSeek-R1は初めて米国製ヘッドモデルと一時的に同等の性能を記録した。

2026年3月、アメリカのClaude Opus 4.6は1503ポイントを獲得し、中国のdola-seed-2.0-previewは1464ポイントを獲得した。

現在、中国と米国のAI技術の差はわずか39ポイントであり、これはパーセンテージに換算すると2.7%に相当する。

さらに注目すべきは、過去1年間におけるこうした役割の逆転の頻度だ。2025年の初めから、両国を代表するトップモデルたちは、アリーナ上で何度も順位を入れ替えている。

数字もほぼ同等だ。

2025年、米国は50の「重要なモデル」を発表し、中国もそれに続いて30の最高級大型モデルを発表した。

トップ層では、OpenAI、Google、Alibaba、Anthropic、xAIがすべて同じ舞台に立っており、世界のトップ5社が利益を均等に分け合っている。

トップ10をさらに見ていくと、中国の機関や企業が4つを占めている。アリババ、ディープシーク、清華大学、そしてバイトダンスだ。

オープンソースのエコシステムの焦点も、今年は明らかに東方へとシフトしている。

DeepSeek、Qwen、GLM、MiniMax、そしてKimiは、いずれもオープンソースの重み付け機能の発展を牽引してきた。

発表論文数、引用数、特許取得件数、産業用ロボット設置台数といった項目も考慮に入れると、中国はこれらの全ての分野で世界第1位にランクされている。

価格もまた、もう一つの争点である。

海外の開発者がXについて計算したところ、Seed 2.0 Proの出力価格はClaude Opus 4.6の約10分の1に過ぎないことが分かった。

高性能で顔にぴったりフィットするデザインが、従来の10分の1の価格で手に入る。この流れはまだ始まったばかりだ。

最先端モデルの90%は産業界から生まれており、前例のないスピードで変革が進んでいる。

昨年発表された最も代表的な95モデルのうち、90%以上は学術機関や政府研究所ではなく、産業界から発表されたものだった。

学術界は最先端から遅れをとっている。

放出速度も異常に加速している。

2026年2月だけでも、Gemini 3.1 Pro、Claude Opus 4.6、GPT-5.3 Codex、Grok 4.20、Qwen 3.5、Seed 2.0 Pro、MiniMax M2.5、GLM-5など、8～9機種のフラッグシップモデルが市場に投入された。

神々の叙任式の周期は「年」から「月」へと変化した。

ベンチマークは1年で上限に達し、AIにはボトルネックがない

最も劇的な変化はプログラミング分野だ。

実際のバグ修正のベンチマークであるSWE-bench Verifiedの達成率は、1年間で60%からほぼ100%に上昇した。

単に数ポイント上昇したというレベルではなく、ほぼ限界に達したと言えるでしょう。

Terminal-Benchは、エージェントが実際の端末タスクを処理する能力をテストするもので、この割合は昨年の20%から77.3%に上昇しました。

サイバーセキュリティ担当者が問題を解決できた成功率は、15%から93%に上昇した。

ジェミニ・ディープシンク社は、国際数学オリンピックで金メダルを獲得しました。

博士号レベルの科学的質問応答（GPQA Diamond）、学術競技数学（AIME）、マルチモーダル推論（MMMU）――これらは当初「人間には到底及ばない」と考えられていたが、最先端のモデルによって全て克服された。

最も分かりやすい例は『人類最後の試験』だ。

これは、様々な分野のトップ専門家が作成した問題を用いて、「AIを抑制し、人間の専門家を優遇する」ように特別に設計されたテストです。

昨年、OpenAIはO1テストで8.8%のスコアを達成しました。わずか1年で、最先端モデルによってスコアはさらに30パーセントポイント上昇しました。現在、Claude Opus 4.6とGemini 3.1 Proはどちらも50%を超えています。

ギザギザの刃先は国際モーターショーで金メダルを獲得できるかもしれないが、時計を読むことはできない。

しかし、同じ指標を用いても、異なる数値が得られた。

最も高性能なモデルは、「アナログ時計を読み取る」というタスクにおいて、50.1%の精度を達成した。

このロボットは、実験室のシミュレーション環境（RLBench）では89.4%の成功率を達成した。しかし、食器洗いや洗濯物のたたみといった家事を行うために実際の家庭環境に置かれると、成功率はたちまち12%にまで低下した。

実験室とキッチンとの差は77パーセントポイントです。

研究者たちはこの現象を「ギザギザのフロンティア」と名付けた。AIの能力分布は均一ではなく、数学オリンピックで金メダルを獲得できるほど優秀でも、現在の時刻を正確に伝えることができない場合もある。

AIは数学オリンピックで金メダルを獲得できるかもしれないが、アナログ時計を理解できる確率はわずか50%しかない。AIの進化は加速しているが、その方向は以前とは異なっている。

さらに、インテリジェントエージェントタスクにおいて、OSWorldテストにおける最先端のAI機能（66.3%）は、人間のベースラインに近づいている。

しかし、科学研究の論理的思考力を具体的に評価するPaperArenaのテストでは、最も強力なAI搭載エージェントでもわずか39%のスコアしか得られず、これは博士課程の学生の能力の半分に過ぎない。

しかし、こうした不均衡はもはや企業がAIを生産ラインに統合することを妨げるものではない。

AI Indexのもう一つの数値によると、世界の企業におけるAI導入率は88%に達している。10社のうち9社は既に何らかの形でAIを業務フローに統合している。

コストもそれに伴って上昇している。AI関連のインシデント件数は、2024年の233件から362件に増加した。

AI分野への資金流入は加速しており、その額は5817億元に達している。

世界の企業向けAI投資額は、2025年までに5,817億ドルに達すると予測されており、これは前年比130%の増加となる。このうち、プライベートエクイティ投資額は3,447億ドルに達すると見込まれており、これは前年比127.5%の増加となる。

両方の曲線はほぼ2倍になった。

国別に見ると、米国は圧倒的に先行している。米国のAI分野へのプライベートエクイティ投資額は2025年に2859億ドルに達した。さらに、米国では年間1953社の新規AIスタートアップ企業が設立されており、これは2位の国の10倍以上の数である。

資金は急速に米国に流入している。しかし、米国のもう一つの重要な資源は、逆方向に流出している。

米国へ移住するAI研究者の数は89％減少した。

その文書の中にあったある数字の羅列に、私は驚かされた。

2017年以降、米国に入国するAI研究者および開発者の数は89%減少した。

さらに重要なのは、この減少傾向が加速していることだ。わずか1年で、減少率は80％に達した。

米国は依然として世界で最もAI研究者の密度が高い国だが、その勢いは衰えつつある。

お金と人の移動に関する曲線が逆転し始めた。これは過去10年間には見られなかった状況だ。

3年間でコンピューティング能力を30倍に向上させる鍵は、ある一社の手にある。

AIの能力向上曲線は加速しており、それを支えるコンピューティング能力の向上曲線はさらに速いペースで進んでいる。

2021年以降、世界のAIコンピューティング能力は合計で30倍に増加した。過去3年間では、毎年3倍以上に増加している。

この傾向を支持している企業はごくわずかだ。

NVIDIAのGPUは、世界のAIコンピューティング能力の60%以上を占めている。AmazonとGoogleは自社開発チップで2位と3位につけているが、両社を合わせてもNVIDIAには遠く及ばない。

これらのチップのほぼすべては、TSMCという単一のファウンドリから供給されている。演算能力の曲線が急峻であればあるほど、脆弱性の範囲は狭くなる。

同時に、コストも上昇している。

世界のAIデータセンターの総電力は29.6GWに達し、これはニューヨーク州のピーク時の電力需要全体に相当します。xAI Grok 4のトレーニングセッション1回あたりの推定二酸化炭素排出量は72,816トン（CO2換算）で、これは17,000台の自動車が1年間走行した場合の排気ガス排出量に相当します。

データセンターをどこに建設するか、電力をどこから調達するか、そして半導体チップをどこで生産するか――この3つの問題は、今年、すべてのAI企業のCEOにとって最も差し迫った頭痛の種となっている。

生成型AIの普及率は3年間で53%に達し、中国の職場では80%以上が利用している。

生成型AIは、わずか3年で世界人口の53%に普及した。

この速度は、パソコンよりも速く、インターネットよりも速い。

しかし、普及率は国によって大きく異なる。シンガポール（61%）とアラブ首長国連邦（54%）はともに米国を上回っている。米国は調査対象国の中で24位にとどまり、普及率は28.3%となっている。

消費者から職場へと視点を移すと、その対照はさらに顕著になる。

報告書に掲載された別のデータによると、2025年までに世界中の従業員の58%が業務でAIを定期的に利用し始める見込みである。しかし、中国、インド、ナイジェリア、アラブ首長国連邦、サウジアラビアの5カ国では、この割合が80%を超えている。

中国における職場でのAI普及率は、すでに世界平均を20パーセントポイント以上上回っている。

さらに興味深いのは、消費者にとっての価値です。

AI Indexの推計によると、生成型AIツールは2026年初頭までに米国消費者に年間1,720億ドルの価値をもたらす見込みです。ユーザー一人当たりの平均価値は2025年から2026年にかけて3倍になると予測されています。

依然として大多数のユーザーは無料版を利用している。

一般の人々は、AIがもたらす価値よりもはるかに低い金額しかAIに支払う意思がない。このギャップこそ、すべてのAI企業が埋めようとしているものだ。

エントリーレベルの求人は激減しており、22歳から25歳までの年齢層向けの開発職は20％も大幅に減少している。

AIインデックス全体の中で、おそらく中国の読者を最も沈黙させたのは、若年層の雇用に関するセクションだっただろう。

22歳から25歳のソフトウェア開発者の数は、2024年以降約20％減少している。

一方、年長の同世代の数は実際に増加している。

これはソフトウェア開発職に限ったことではない。顧客サービスなど、AIとの関わりが深い他の業界でも同様の傾向が見られる。

さらに憂慮すべきは、企業調査の結果だ。調査対象となった経営幹部は概して、今後の人員削減規模はここ数ヶ月の削減規模をさらに上回ると予想している。

これはマクロ的な失業率の問題ではなく、初級レベルの雇用が具体的に消滅していくことの問題だ。

最初の仕事を失うということは、キャリアアップの階段の一段を断たれることを意味します。その長期的な影響は、現時点では誰にも完全に予測することはできません。

AIは科学的発見の方法を根本的に変えつつある。

雇用市場が低迷しているなら、科学市場は活況を呈していると言えるだろう。

自然科学、物理科学、生命科学の分野におけるAI関連論文数は、2025年には前年比で26%から28%増加した。

具体的な応用例を挙げると、今年はAIがエンドツーエンドの気象予報プロセス全体を初めて成功裏に完了させた年となった。従来の数値モデルによる介入を一切行わずに、生の気象観測データから気温、風速、湿度の最終予報を直接出力する。

AIは、「論文執筆の支援」や「数値計算の支援」から、「自ら発見を行う」段階へと進化している。

病院にも同じことが言える。2025年までに、多くの病院が患者との会話から自動的に診療記録を生成できるAIツールを導入し始めた。複数の病院システムの医師たちは、診療記録の作成に費やす時間が最大83%減少し、燃え尽き症候群も大幅に減少したと報告している。

しかし、同じ指標は医療AIに対して冷水を浴びせる結果となった。500件以上の臨床AI研究をレビューしたところ、研究のほぼ半数が試験形式のデータセットに依存しており、実際の臨床データを使用した研究はわずか5%に過ぎなかったことが判明した。

AIが医師のタイピング時間を短縮できることは確かだ。しかし、実際の患者におけるAIの臨床的価値については、依然として多くの疑問が残されている。

独学の波が世界を席巻し、正規の教育は後れを取っている。

正規教育はAIの普及に遅れをとっている。

米国では、高校生と大学生の5人に4人が、学業をこなすためにAIを利用している。しかし、AI利用に関する方針を定めている高校は半数に過ぎず、さらに、これらの方針が明確に記述されていると考えている教師はわずか6%にとどまっている。

生徒たちは走り出しているのに、先生はまだ立ち止まっている。ルールはまだ説明されていないのだ。

正規教育が遅れをとる一方で、独学の波が世界中で押し寄せている。報告書によると、AIエンジニアリングスキルの学習が最も急速に伸びている3カ国は、アラブ首長国連邦、チリ、南アフリカである。

アメリカでもないし、ヨーロッパでもない。

スキル習得において最も急な部分は、誰も注目していないところにある。

最も強力なモデルは、最も不透明なモデルとなり、専門家と一般市民の間に溝を生み出す。

最も強力なモデルが、最も不透明なモデルになりつつある。

Foundation Model Transparency Indexの今年の平均スコアは、昨年の58から40に低下した。AI Indexは、Google、Anthropic、OpenAIを名指しし、これらの企業が最新モデルのトレーニングデータサイズとトレーニング時間を公表しなくなったと指摘した。

昨年発表された最も代表的な95モデルのうち、80モデルは学習コードが公開されていなかった。

世論はより複雑化している。

世界的に見ると、AIは有害よりも有益だと考える人の割合は52%から59%に上昇した。しかし、同時期に、AIに対して不安を感じる人の割合は50%から52%に上昇した。

成長は両方向で同時に起こっている。

最も意見が分かれているのは米国だ。AIによって仕事が良くなると信じているアメリカ人はわずか33%で、世界平均の40%を大きく下回っている。また、AIに関する政府の規制に対する信頼度も、調査対象国の中で最も低く、31%にとどまっている。

シンガポール国民は、政府によるAI規制に対して81％の信頼度を示している。

サム・アルトマンの自宅が最近襲撃された事件を受けて、シリコンバレーの人々は、インスタグラムのコメント欄で一般の人々からの同情がほとんど見られず、「もっと激しい反応があってもよかった」と感じる人もいたことに「驚いた」。

彼らは事態がここまで悪化していたことに気づいていなかった。

調査報告書で引用されているピュー研究所とイプソスのデータによると、AIが雇用、医療、経済に与える影響について、専門家と一般市民の認識の差は概ね30パーセントポイントを超え、最大の差は50パーセントポイントに達する。

一方では、実験室での数値は急上昇しているが、他方では、一般市民の心には不安が募っている。

真ん中に橋はない。

結論は

423ページに及ぶ報告書には数百もの図表が掲載されていたが、実際に描かれた図表はたった一つだけだった。

横軸は時間、縦軸は能力を表します。

モデルの性能向上曲線は急上昇しており、計算能力も急上昇、投資額も急上昇、そして導入率も急上昇している。それ以外のものはすべて停滞か減少傾向にある。

以上が2026年AIインデックスに関する内容です。

AIは急速に進化している。他のあらゆる分野は遅れをとっている。

この業界にいるなら、今問うべきは「未来はどうなるのか？」ではなく、「自分はどの曲線上にいるのか？」だ。