스탠포드 대학의 423페이지 분량의 AI 보고서에 따르면, 중국과 미국의 AI 기술 격차는 불과 2.7%에 불과하며, 칭화 대학의 딥시크(DeepSeek)는 세계 10위권에 진입했습니다.

저자: 뉴즈위안

편집: 슬리피 피치

[새로운 정보 요약] 스탠포드의 "2026 AI 지수 보고서"가 발표되었습니다! 432페이지에 달하는 이 보고서는 매우 귀중한 정보를 담고 있습니다. AI 분야에서 중국과 미국의 격차가 거의 사라져 2.7%에 불과합니다. 세계 최고 수준의 AI 인재 풀은 매년 95명 정도만 배출하며, 대부분 대형 기술 기업에 집중되어 있습니다. 특히 주목할 만한 점은 22~25세 개발자 고용이 20% 감소했다는 것입니다.

오늘 스탠포드 HAI는 "2026 AI 지수 보고서"를 발표했습니다!

423페이지 분량의 이 연례 보고서는 글로벌 AI 산업의 최신 권력 구도를 종합적으로 보여줍니다.

이 보고서는 핵심적인 결론을 내립니다. 인공지능의 역량은 빠르게 성장하고 있지만, 인류가 이를 측정하고 관리하는 능력은 그 속도를 따라가지 못하고 있다는 것입니다.

가장 충격적인 결론은 바로 이것입니다.

중국과 미국 AI 모델 간의 성능 격차는 상당 부분 사라졌으며, 양측은 치열한 경쟁 속에서도 우위를 자주 바꿔왔습니다. 현재 앤트로픽의 우위는 불과 2.7%에 불과합니다.

미국은 인공지능에 그 어느 나라보다 많은 돈을 투자하고 있지만, 최고의 인재를 유치하는 데는 점점 더 어려움을 겪고 있습니다.

보고서는 또한 인공지능의 발전이 소위 "병목 현상"에 부딪히지 않고 오히려 전례 없는 속도로 가속화되고 있다고 지적합니다.

지난 한 해 동안 전 세계 최고 수준의 모델 중 90% 이상이 박사 수준의 과학 문제, 다중 모드 추론 및 경쟁 수학 분야에서 인간의 성과와 같거나 심지어 능가했습니다.

특히 코딩 능력 측면에서 SWE-bench 점수는 1년 만에 60%에서 거의 100%까지 급상승했습니다.

하지만 AI는 현실을 왜곡하여 보여주는 매우 심각한 "불균형적인" 접근 방식을 드러냅니다.

LLM은 IMO 금메달을 딸 수 있지만, 아날로그 시계를 정확하게 읽지는 못하며 정확도는 50.1%에 불과합니다.

한편, 인공지능이 일자리를 빼앗을 것이라는 예측은 현실이 되었고, 가장 먼저 피해를 보는 것은 오늘날의 젊은 "노동 계층"이다.

자, 이제 진짜를 알려드리겠습니다. "2026 AI 지수 보고서"에서 주목해야 할 12가지 핵심 트렌드를 소개합니다.

주요 내용을 한눈에 살펴보세요:

전 세계 AI 컴퓨팅 성능은 3년 만에 30배 증가했으며, 엔비디아가 시장 점유율 60%를 차지하고 있고, 거의 모든 칩은 TSMC에서 생산하고 있습니다.
전 세계 기업의 인공지능(AI) 투자액은 2025년까지 5,817억 달러에 달할 것으로 예상되며, 이는 전년 대비 두 배 이상 증가한 수치입니다. 이 중 미국이 거의 절반을 차지할 것으로 전망됩니다.
미국에 오는 인공지능 연구자의 수는 7년 만에 89% 감소했으며, 특히 지난 한 해 동안에만 80%나 줄었습니다.
2024년 이후 22~25세 소프트웨어 개발자 고용이 20% 감소했으며, 특히 신입 개발자 자리가 주요 감축 대상으로 지목되었습니다.
중국은 총 85대의 공공 AI 슈퍼컴퓨터를 구축했는데, 이는 북미의 두 배가 넘는 수치로 세계 1위입니다.
중국 직장에서의 AI 활용률은 80%를 넘어 세계 평균인 58%를 훨씬 웃돈다.
가장 강력한 모델들은 점점 더 불투명해지고 있습니다. 대표적인 모델 95개 중 80개는 공개적으로 이용 가능한 학습 코드가 없습니다.

중국과 미국의 근접성 격차가 불과 2.7%로 좁혀졌습니다.

스탠포드 대학은 2023년 5월 이후 아레나 랭킹에서 상위권을 차지한 미국과 중국의 선수들을 동일한 좌표계에 표시했습니다.

2023년 5월, GPT-4-0314는 1320점으로 선두를 달렸고, 중국은 chatglm-6b에 머물러 300점 이상의 차이를 보였습니다.

2025년 2월, DeepSeek-R1은 처음으로 미국 최고 모델과 잠시 동률을 기록했습니다.

2026년 3월, 미국의 Claude Opus 4.6은 1503점을, 중국의 dola-seed-2.0-preview는 1464점을 기록했습니다.

현재 중국과 미국의 AI 기술 격차는 불과 39포인트로, 백분율로 환산하면 2.7%에 불과합니다.

더욱 주목할 만한 점은 지난 1년 동안 이러한 역할 역전이 빈번하게 발생했다는 것입니다. 2025년 초부터 양국의 주요 모델들이 아레나에서 여러 차례 순위를 바꿔왔습니다.

수치도 대략 비슷합니다.

2025년 미국은 50개의 "중요 모델"을 공개했고, 중국도 뒤이어 30개의 최고급 대형 모델을 공개했습니다.

최상위권에서는 OpenAI, Google, Alibaba, Anthropic, xAI가 모두 동등한 위치에 있으며, 세계 상위 5개 기업이 수익을 균등하게 분배합니다.

상위 10위권을 더 살펴보면, 알리바바, 딥시크, 칭화대학교, 바이트댄스 등 중국 기관 및 기업이 4자리를 차지하고 있습니다.

올해 오픈 소스 생태계의 중심이 동쪽으로 분명히 이동했습니다.

DeepSeek, Qwen, GLM, MiniMax, Kimi는 모두 오픈 소스 가중치 계산 기능의 발전에 크게 기여했습니다.

논문 발표 수, 인용 횟수, 특허 출원 건수, 산업용 로봇 설치 건수까지 고려한다면 중국은 이 모든 분야에서 세계 1위를 차지하고 있습니다.

가격 또한 중요한 요소입니다.

해외 개발자들이 X에 대한 계산을 해본 결과, Seed 2.0 Pro의 출시 가격은 Claude Opus 4.6의 10분의 1 정도에 불과한 것으로 나타났습니다.

고성능에 얼굴에 밀착되는 디자인을 10분의 1 가격으로 만나보세요. 이로 인한 파급 효과는 이제 막 시작일 뿐입니다.

최첨단 모델의 90%는 산업계에서 탄생하며, 전례 없는 속도의 변화를 이루어냅니다.

지난해 발표된 가장 대표적인 모델 95개 중 90% 이상이 학계나 정부 연구소가 아닌 산업계에서 개발되었습니다.

학계는 시대의 흐름에 뒤처지고 있다.

출시 속도 또한 비정상적으로 빨라지고 있습니다.

2026년 2월 한 달 동안에만 Gemini 3.1 Pro, Claude Opus 4.6, GPT-5.3 Codex, Grok 4.20, Qwen 3.5, Seed 2.0 Pro, MiniMax M2.5, GLM-5를 포함한 8~9개의 플래그십 모델이 시장에 출시되었습니다.

신들의 대관식 주기가 "년"에서 "월"로 바뀌었습니다.

벤치마크는 1년 안에 한계에 도달했고, AI에는 병목 현상이 없다.

프로그래밍 분야에서 가장 급격한 변화가 나타납니다.

실제 버그 수정 벤치마크인 SWE-bench Verified에서 검증 완료율이 1년 만에 60%에서 거의 100%로 증가했습니다.

단순히 몇 포인트 오른 정도가 아니라, 사실상 한계점에 도달했습니다.

터미널벤치(Terminal-Bench)는 에이전트가 실제 터미널 작업을 처리하는 능력을 테스트하는데, 이 비율은 작년 20%에서 올해 77.3%로 증가했습니다.

사이버 보안 담당자의 문제 해결 성공률이 15%에서 93%로 증가했습니다.

제미니 딥씽크(Gemini Deep Think)가 국제수학올림피아드에서 금메달을 수상했습니다.

박사 수준의 과학적 질문 답변(GPQA Diamond), 학술 경시대회 수학(AIME), 다중모드 추론(MMMU)은 원래 "인간이 넘어설 수 없는 영역"으로 여겨졌지만, 최첨단 모델들이 이 모든 영역을 정복했습니다.

가장 대표적인 예는 '인류의 마지막 시험'이다.

이 시험은 다양한 분야의 최고 전문가들이 제공한 문제로 구성되어 있으며, 인공지능의 능력을 약화시키고 인간 전문가에게 유리하도록 특별히 설계되었습니다.

작년에 OpenAI는 O1 테스트에서 8.8%의 점수를 기록했습니다. 불과 1년 만에 최첨단 모델 덕분에 점수가 30%포인트나 상승했습니다. 현재 Claude Opus 4.6과 Gemini 3.1 Pro는 모두 50%를 넘어섰습니다.

톱니 모양의 앞날은 국제자동차연맹(IMO) 금메달을 딸 수는 있지만, 시계를 읽을 수는 없습니다.

하지만 같은 지표를 사용했더니 다른 수치가 나왔습니다.

가장 성능이 뛰어난 모델은 "아날로그 시계 읽기" 작업에서 50.1%의 정확도를 달성했습니다.

해당 로봇은 실험실 시뮬레이션 환경(RLBench)에서 89.4%의 성공률을 달성했습니다. 그러나 설거지나 빨래 개기 등 실제 가정 환경에서 가사일을 수행하도록 배치했을 때, 성공률은 즉시 12%로 떨어졌습니다.

실험실과 주방의 차이는 77%포인트입니다.

연구자들은 이러한 현상을 "들쭉날쭉한 경계"라고 명명했습니다. 인공지능의 능력 분포는 고르지 않습니다. 수학 올림피아드에서 금메달을 땄지만 현재 시간을 정확하게 알려주지 못할 수도 있습니다.

인공지능은 수학 올림피아드에서 금메달을 딸 수 있지만, 아날로그 시계를 이해할 확률은 50%에 불과합니다. 인공지능은 빠르게 발전하고 있지만, 그 방향은 이전과는 다릅니다.

또한, 지능형 에이전트 작업에서 OSWorld 테스트의 최첨단 AI 기능(66.3%)은 인간의 기준선에 근접하고 있습니다.

하지만 과학 연구 논리를 구체적으로 평가하는 PaperArena 테스트에서 가장 강력한 AI 기반 에이전트조차 39%의 점수밖에 얻지 못했는데, 이는 박사 과정 학생의 능력의 절반에 불과합니다.

하지만 이러한 불균형은 더 이상 기업들이 AI를 생산 라인에 통합하는 것을 막지 못합니다.

AI Index의 또 다른 통계에 따르면 전 세계 기업의 AI 도입률은 88%에 달했습니다. 즉, 기업 10곳 중 9곳이 이미 어떤 형태로든 AI를 업무 흐름에 통합한 것입니다.

비용도 함께 증가하고 있습니다. AI 관련 사고 발생 건수는 2024년 233건에서 362건으로 증가했습니다.

인공지능 분야에 막대한 자금이 쏟아지고 있다: 5817억 위안.

전 세계 기업의 AI 투자액은 2025년까지 5,817억 달러에 달할 것으로 예상되며, 이는 전년 대비 130% 증가한 수치입니다. 이 중 사모펀드 투자는 3,447억 달러에 이를 것으로 전망되며, 이는 전년 대비 127.5% 증가한 것입니다.

두 곡선 모두 거의 두 배로 증가했습니다.

국가별로 살펴보면 미국이 압도적으로 앞서 있습니다. 미국의 인공지능(AI) 분야 사모펀드 투자액은 2025년까지 2,859억 달러에 달할 것으로 예상됩니다. 또한, 미국에서는 매년 1,953개의 새로운 AI 스타트업이 설립되는데, 이는 2위 국가보다 10배 이상 많은 수치입니다.

막대한 자금이 미국으로 빠르게 유입되고 있습니다. 하지만 미국의 또 다른 핵심 자원은 정반대 방향으로 흘러가고 있습니다.

인공지능 연구자들이 미국으로 이주하는 수가 89% 감소했습니다.

문서에 있는 숫자들 중 하나가 저를 깜짝 놀라게 했습니다.

2017년 이후 미국에 입국하는 AI 연구원 및 개발자의 수는 89% 감소했습니다.

더욱 중요한 것은 이러한 감소세가 가속화되고 있다는 점입니다. 불과 1년 만에 감소율이 80%에 달했습니다.

미국은 여전히 전 세계에서 인공지능 연구자가 가장 밀집된 국가이지만, 그 공급은 점차 줄어들고 있다.

돈과 사람의 흐름이 역전되기 시작했습니다. 이는 지난 10년 동안 볼 수 없었던 현상입니다.

3년 만에 컴퓨팅 성능을 30배 향상시키는 열쇠는 단 한 회사의 손에 달려 있습니다.

인공지능 역량 발전 속도는 가속화되고 있으며, 그 속도를 뒷받침하는 컴퓨팅 성능 발전 속도는 훨씬 더 빠릅니다.

2021년 이후 전 세계 AI 컴퓨팅 파워는 총 30배 증가했습니다. 지난 3년간은 매년 3배 이상 증가했습니다.

이러한 추세를 지지하는 기업은 소수에 불과합니다.

엔비디아의 GPU는 전 세계 AI 컴퓨팅 성능의 60% 이상을 차지합니다. 아마존과 구글은 자체 개발 칩으로 각각 2위와 3위를 차지하고 있지만, 두 회사의 칩을 합쳐도 엔비디아를 따라잡기에는 한참 부족합니다.

이러한 칩들은 거의 모두 TSMC라는 단일 파운드리에서 생산됩니다. 컴퓨팅 성능 곡선이 가파를수록 취약점은 더욱 좁아집니다.

동시에 비용도 증가하고 있습니다.

전 세계 AI 데이터 센터의 총 전력 소비량은 29.6GW에 달하며, 이는 뉴욕주 전체의 피크 시간대 전력 수요량과 맞먹는 수준입니다. xAI Grok 4 학습 세션 한 번당 발생하는 탄소 배출량은 이산화탄소 환산 72,816톤으로 추산되며, 이는 자동차 17,000대가 1년 동안 운행할 때 발생하는 배기가스 배출량과 동일한 양입니다.

데이터 센터를 어디에 건설할 것인가, 전력은 어디서 공급받을 것인가, 그리고 칩은 어디서 생산할 것인가—이 세 가지 질문은 올해 모든 AI 기업 CEO들이 직면한 가장 시급한 골칫거리가 되었습니다.

생성형 AI의 보급률은 3년 만에 53%에 달했으며, 중국 직장에서는 사용률이 80%를 넘어섰습니다.

생성형 인공지능은 3년 만에 전 세계 인구의 53%에 보급률을 달성했습니다.

이 속도는 개인용 컴퓨터보다 빠르고 인터넷보다도 빠릅니다.

하지만 보급률은 국가별로 큰 차이를 보입니다. 싱가포르(61%)와 아랍에미리트(54%)는 모두 미국보다 높은 보급률을 기록했습니다. 미국은 조사 대상 국가 중 24위에 그쳤으며, 보급률은 28.3%에 불과합니다.

소비자의 입장에서 직장의 입장으로 시선을 돌리면 그 차이는 더욱 두드러진다.

보고서의 또 다른 데이터에 따르면 2025년까지 전 세계 직원의 58%가 업무에 인공지능(AI)을 정기적으로 사용하기 시작할 것으로 예상됩니다. 그러나 중국, 인도, 나이지리아, 아랍에미리트, 사우디아라비아 등 5개국에서는 이 수치가 80%를 넘어섭니다.

중국의 직장 내 인공지능(AI) 도입률은 이미 세계 평균보다 20%포인트 이상 높습니다.

더욱 흥미로운 점은 소비자 가치입니다.

AI Index는 생성형 AI 도구가 2026년 초까지 미국 소비자에게 연간 1,720억 달러의 가치를 창출할 것으로 추산합니다. 사용자당 평균 가치는 2025년에서 2026년 사이에 세 배로 증가할 것입니다.

대다수의 사용자는 여전히 무료 버전을 사용하고 있습니다.

일반인들은 인공지능이 자신에게 제공하는 가치보다 훨씬 적은 금액을 지불할 의향이 있습니다. 모든 인공지능 기업들이 메우려고 노력하는 것이 바로 이 격차입니다.

신입 사원 채용이 급감했으며, 특히 22~25세 연령대의 개발직 채용은 무려 20%나 줄었습니다.

AI 지수 전체에서 중국 독자들의 반응을 가장 잠재웠던 부분은 아마도 청년 고용에 관한 내용이었을 것이다.

2024년 이후 22세에서 25세 사이의 소프트웨어 개발자 수는 약 20% 감소했습니다.

한편, 나이가 더 많은 동료들의 수는 실제로 증가하고 있습니다.

이러한 현상은 소프트웨어 개발 직무에만 국한되지 않습니다. 고객 서비스와 같이 AI 노출도가 높은 다른 산업에서도 동일한 패턴이 나타나고 있습니다.

더욱 우려스러운 것은 기업 설문조사 결과입니다. 설문에 참여한 임원들은 대체로 향후 해고 규모가 지난 몇 달간보다 더 클 것으로 예상하고 있습니다.

이것은 거시적인 실업률에 관한 문제가 아니라, 초급 일자리의 정확한 감소에 관한 문제입니다.

첫 직장을 잃는다는 것은 경력 사다리의 한 단계를 건너뛰는 것과 같습니다. 이것이 장기적으로 어떤 영향을 미칠지는 현재로서는 누구도 정확히 예측할 수 없습니다.

인공지능은 과학적 발견이 이루어지는 방식을 새롭게 쓰고 있습니다.

고용 시장이 침체기라면, 과학 시장은 활발한 시장입니다.

자연과학, 물리과학, 생명과학 분야의 인공지능 관련 논문 수는 2025년까지 전년 대비 26%~28% 증가할 것으로 예상됩니다.

구체적인 적용 사례로 살펴보면, 올해는 인공지능이 날씨 예보의 전 과정을 성공적으로 완료한 첫 해입니다. 기존의 수치 모델을 전혀 사용하지 않고, 원시 기상 관측 데이터로부터 기온, 풍속, 습도에 대한 최종 예보를 직접 도출해냅니다.

인공지능은 "논문 작성을 돕는 것"이나 "수치 계산을 돕는 것"에서 "스스로 발견을 하는 것"으로 진화하고 있습니다.

병원도 마찬가지입니다. 2025년까지 많은 병원에서 환자와의 대화를 바탕으로 임상 기록을 자동으로 생성할 수 있는 AI 도구를 도입하기 시작했습니다. 여러 병원 시스템의 의사들은 진료 기록 작성에 소요되는 시간이 최대 83% 감소했고, 직무 소진도 크게 줄었다고 보고했습니다.

하지만 같은 조사에서 의료 AI에 대한 부정적인 결과가 나왔습니다. 500건 이상의 임상 AI 연구를 검토한 결과, 연구의 거의 절반이 시험 유형의 데이터 세트에 의존했고, 실제 임상 데이터를 사용한 연구는 5%에 불과했습니다.

인공지능이 의사들이 타이핑하는 데 소요되는 시간을 줄여줄 수 있다는 것은 확실합니다. 하지만 실제 환자에게 인공지능이 얼마나 유용한지는 여전히 많은 의문점을 남깁니다.

자기주도 학습의 물결이 전 세계를 휩쓸면서 정규 교육은 그 뒤를 따라가지 못하고 있다.

정규 교육은 인공지능의 속도를 따라가지 못하고 있다.

미국에서는 고등학생과 대학생 5명 중 4명이 과제 수행에 인공지능(AI)을 활용하고 있습니다. 그러나 고등학교 중 AI 사용 정책을 마련한 곳은 절반에 불과하며, 이러한 정책이 명확하게 작성되었다고 생각하는 교사는 6%에 그칩니다.

학생들은 앞서 달려가고 있는데 선생님은 여전히 제자리에 서 있다. 아직 규칙 설명도 받지 못했다.

정규 교육은 뒤처지고 있지만, 자기 주도 학습의 물결이 전 세계를 휩쓸고 있습니다. 보고서에 따르면 AI 엔지니어링 기술 학습이 가장 빠르게 성장하는 세 나라는 아랍에미리트, 칠레, 남아프리카공화국입니다.

여기는 미국도 아니고, 유럽도 아니야.

실력 향상 곡선의 가장 가파른 부분은 아무도 주목하지 않는 곳이다.

가장 강력한 모델이 가장 투명성이 떨어지는 모델이 되어 전문가와 대중을 갈라놓고 있다.

가장 강력한 모델이 가장 불투명한 모델이 되어가고 있다.

재단 모델 투명성 지수(Foundation Model Transparency Index)의 올해 평균 점수는 작년 58점에서 40점으로 하락했습니다. AI Index는 구글, 앤트로픽, 오픈AI를 직접적으로 지목하며 이들 기업들이 최신 모델의 학습 데이터 크기와 학습 시간을 공개하지 않고 있다고 지적했습니다.

지난해 공개된 가장 대표적인 모델 95개 중 80개는 학습 코드가 공개되지 않았습니다.

대중의 정서는 더욱 복잡해졌다.

전 세계적으로 인공지능이 해로운 점보다 유익한 점이 더 많다고 믿는 사람들의 비율은 52%에서 59%로 증가했습니다. 그러나 같은 기간 동안 인공지능에 대해 불안감을 느끼는 사람들의 비율은 50%에서 52%로 증가했습니다.

성장은 양방향으로 동시에 일어나고 있습니다.

가장 의견이 분분한 나라는 미국입니다. 미국인 중 인공지능이 자신의 일자리를 더 좋게 만들 것이라고 믿는 사람은 33%에 불과하며, 이는 세계 평균인 40%보다 훨씬 낮은 수치입니다. 또한 미국인들은 조사 대상 국가 중 정부의 인공지능 규제에 대한 신뢰도가 가장 낮은 31%를 기록했습니다.

싱가포르 국민들은 정부의 인공지능 규제에 대해 81%의 신뢰도를 보이고 있습니다.