출처: AI 캠브리콘
지난번 입출력 회의 이후 또 한 해가 지났습니다.
구글 CEO는 발표 초반부터 분명한 메시지를 전달했습니다. 지난 한 해 동안 AI 산업은 새로운 국면에 접어들었으며, 사람들은 더 이상 기술 자체에만 관심을 두는 것이 아니라 AI가 일상생활 제품에 진정한 가치를 가져다주기를 바란다는 것입니다. 오늘 발표는 바로 그 해답입니다.
토큰 수량: 480조에서 30경까지
토큰은 AI 도입 규모를 측정하는 간단한 지표입니다.
2년 전 구글의 여러 제품은 한 달에 총 9조 7천억 개의 토큰을 처리했습니다. 작년 구글 I/O 행사에서는 그 수치가 약 480조 개로 증가했고, 올해는 3.2경 개를 넘어 7배나 급증했습니다.
개발자 측과 기업 측 모두에서 얻은 데이터는 똑같이 인상적입니다.
매달 850만 명 이상의 개발자가 Google 모델을 사용하여 앱을 개발합니다.
현재 모델 API는 분당 약 190억 개의 토큰을 처리합니다.
지난 12개월 동안 375개 이상의 Google Cloud 고객이 각각 1조 개 이상의 토큰을 처리했습니다.
제품 규모: 13개 제품, 사용자 10억 명 이상
현재 구글은 월간 활성 사용자 수가 10억 명이 넘는 제품을 13개 보유하고 있으며, 그중 5개는 30억 명이 넘습니다.
검색은 여전히 AI 제품을 접하는 가장 널리 사용되는 진입점입니다. AI Overviews는 월간 활성 사용자 수가 25억 명이 넘습니다. 검색 역사상 가장 큰 업그레이드인 AI 모드는 단 1년 만에 월간 활성 사용자 10억 명을 돌파했으며, 사용자들의 검색 활용 방식 또한 단일 검색어에서 지속적인 대화로 진화하고 있습니다.
제미니 앱은 작년 I/O 행사 당시 월간 활성 사용자 수가 4억 명에 달했으며, 올해는 9억 명을 돌파하여 두 배 이상 증가했고, 일일 요청량은 7배 이상 늘어났습니다. 나노 바나나 이미지 생성 모델은 누적 500억 개 이상의 이미지를 생성했습니다.
대화형 AI가 점점 더 많은 제품에 통합되고 있습니다.
유튜브에 물어보세요
YouTube에는 방대한 동영상 라이브러리가 있지만, 정말 관련성 있는 콘텐츠를 찾는 것은 쉽지 않습니다. Ask YouTube는 이러한 문제를 해결하기 위해 검색 환경을 새롭게 디자인했습니다. 단순히 일치하는 동영상을 보여주는 것을 넘어, 가장 관련성이 높은 부분으로 바로 이동할 수 있도록 했습니다. 현재 테스트 중이며, 올여름 미국에서 정식 출시될 예정입니다.
Docs Live
Google Docs에 새로운 음성 기능인 Docs Live가 추가되었습니다. 이전에는 Gemini를 사용하여 문서를 작성하려면 직접 입력해야 했지만, 이제 마이크에 대고 아이디어를 말하기만 하면 Gemini가 자동으로 문서를 정리해 줍니다. 향후 업데이트를 통해 음성으로 문서를 직접 생성하고 편집하는 기능도 지원될 예정입니다. Docs Live는 올여름 Google Docs 구독자에게 순차적으로 제공될 예정이며, Gmail과 Keep에도 같은 시기에 음성 기능이 추가될 예정입니다.
Ask Maps
지도 앱이 10년 만에 최대 규모의 업데이트를 진행하며, 더욱 복잡하고 긴 질문을 지원하는 '지도에 물어보기' 기능이 포함됩니다.
인프라: 자본 지출은 310억 달러에서 1,800억 달러에 이릅니다.
이러한 제품의 대규모 운영을 지원하려면 막대한 인프라 투자가 필요합니다.
2022년 구글의 연간 자본 지출은 310억 달러였습니다. 올해는 약 1,800억 달러에서 1,900억 달러에 이를 것으로 예상되는데, 이는 2012년의 약 6배에 달하는 수치입니다.
칩 수준에서 구글은 클라우드 넥스트(Cloud Next)에서 8세대 TPU를 출시했는데, 이는 학습과 추론을 위한 전용 아키텍처를 갖춘 듀얼 칩 전략을 처음으로 채택한 것입니다.
TPU 8t 는 대규모 사전 학습에 사용되며, 이전 세대보다 약 3배 높은 연산 능력을 자랑합니다. JAX 및 Pathways와 결합하여 학습이 더 이상 단일 데이터 센터에 국한되지 않고 여러 사이트에 분산될 수 있습니다. 전 세계적으로 100만 개 이상의 TPU를 이용할 수 있어 세계 최대 규모의 학습 클러스터를 구축할 수 있습니다. 모델 학습 시간은 수개월에서 수주로 단축되었습니다.
TPU 8i 는 추론에 특화되어 설계되었으며, 포괄적인 속도 최적화 기능을 제공합니다. 두 칩 모두 이전 모델보다 약 두 배의 에너지 효율을 제공합니다.
새로운 모델: 제미니 옴니 및 제미니 3.5 플래시
제미니 옴니
인공지능(AI)은 텍스트 예측에서 현실 시뮬레이션으로 전환하고 있습니다. 구글이 새롭게 출시한 멀티모달 월드 모델인 제미니 옴니(Gemini Omni)는 모든 모달리티(전역, 영상, 텍스트)의 입력을 받아 모든 모달리티의 출력을 생성할 수 있습니다. 초기 버전은 주로 비디오를 출력하며, 이미지와 텍스트 지원은 추후 추가될 예정입니다. 제미니 옴니 플래시(Gemini Omni Flash)는 현재 제미니 앱, 구글 플로우, 유튜브 쇼츠에서 이용 가능하며, 개발자와 기업 고객은 향후 몇 주 내에 API를 통해 접근할 수 있게 됩니다.
1) 자연어를 이용한 비디오 편집
Omni는 대화를 통한 점진적 비디오 편집을 지원하며, 각 지시는 이전 지시를 기반으로 구축되어 캐릭터 간의 일관성, 물리 법칙 준수 및 장면 간의 조화를 보장합니다.
2) 물리적 이해와 세계 지식
옴니는 중력, 운동 에너지, 유체 역학과 같은 물리 법칙을 더욱 정확하고 직관적으로 이해하여 생성된 장면을 더욱 사실적으로 표현합니다. 또한, 제미니의 역사적, 과학적, 문화적 배경 지식을 활용하여 단순히 패턴을 매칭하는 것을 넘어 언어, 이미지, 의미를 연결할 수 있습니다.
3) 입력값의 모든 조합
Omni는 이미지, 텍스트, 비디오 및 오디오를 동시에 입력으로 사용하여 일관된 스타일의 출력을 생성합니다.
4) 디지털 아바타
사용자는 Omni를 사용하여 자신만의 디지털 아바타를 만들고, 자신과 똑같이 생기고 목소리가 비슷한 영상을 생성할 수 있습니다. 구글은 영상 속 오디오와 음성 수정 작업을 계속 테스트 중이라고 밝혔습니다.
하지만 일부 사용자의 초기 테스트 결과, 오미니의 비디오 생성 성능이 상당히 떨어져 시던스 2.0에 한참 못 미치는 것으로 나타났습니다.
제미니 3.5 플래시
구글은 오늘 최첨단 인텔리전스와 이동성을 결합한 차세대 모델인 제미니 3.5 플래시를 출시했습니다.
3.1 Pro 버전과 비교했을 때, 3.5 Flash 버전은 Terminal-Bench 2.1(76.2%), GDPval-AA(1656 Elo), MCP Atlas(83.6%) 등 여러 벤치마크에서 우수한 성능을 보였으며, 특히 CharXiv Reasoning에서 멀티모달 이해 부문에서 84.2%의 정확도를 달성했습니다. 이러한 성능 향상은 실세계에서 경제적 가치가 있는 작업을 측정하는 GDPval 벤치마크에서 두드러지게 나타납니다. 속도 측면에서도 3.5 Flash는 다른 최첨단 모델보다 초당 4배 빠른 속도로 토큰을 출력합니다.
3.5 Flash는 Antigravity와 연동하여 여러 하위 에이전트가 협업하여 대규모의 복잡한 작업을 처리하도록 예약할 수 있습니다.
프런트엔드 생성 기능은 여전히 매우 강력합니다. 멀티모달 기능을 기반으로 Flash 3.5는 더욱 풍부한 대화형 웹 페이지 UI와 그래픽을 생성할 수 있으며, 예를 들어 AI Studio에서 연구 논문에 직접 사용할 수 있는 대화형 애니메이션을 생성할 수 있습니다.
가격 측면에서 3.5 Flash는 유사한 최첨단 모델에 비해 절반도 안 되는 가격입니다. 구글은 주요 기업들이 매일 약 1조 개의 토큰을 처리한다고 추산하며, 만약 이들이 워크로드의 80%를 다른 최첨단 모델에서 3.5 Flash로 전환한다면 연간 10억 달러 이상을 절감할 수 있을 것으로 예상합니다.
Gemini 3.5 플래시는 오늘부터 모든 사용자와 API에서 사용할 수 있습니다. Gemini 3.5 Pro는 현재 구글 내부에서 사용 중이며 다음 달에 출시될 예정입니다.
구글 내부 데이터에 따르면, 안티그래비티 플랫폼과 3.5 플래시 덕분에 AI 개발 도구의 토큰 처리량은 3월 하루 5천억 개에서 현재 하루 3조 개 이상으로 두 배 이상 증가했습니다.
Antigravity 2.0: 에이전트 개발 플랫폼
원래 AI 프로그래밍 환경이었던 Antigravity는 이제 완전한 자율 AI 에이전트 개발 및 관리 플랫폼으로 확장되고 있습니다.
Antigravity 2.0은 에이전트 간 상호 작용을 위한 중앙 허브 역할을 하는 새로운 독립형 데스크톱 애플리케이션으로, 사용자가 다양한 에이전트를 조정하여 여러 작업을 처리할 수 있도록 합니다. 속도 면에서 이 버전은 특별히 최적화된 Flash 버전을 사용하여 다른 최첨단 모델보다 12배 더 빠릅니다. Antigravity 2.0은 Codex와 거의 똑같이 생겼습니다. 😂
Antigravity 사용자는 오늘부터 해당 기능을 체험할 수 있습니다. 자세한 내용은 공식 발표를 참조하세요.
https://deepmind.google/technologies/antigravity/
제미니 스파크: 24시간 연중무휴 개인 AI 에이전트
제미니 앱은 사용자의 승인을 받아 사용자를 대신하여 디지털 세계에서 다양한 행동을 수행하는 개인 AI 에이전트인 '제미니 스파크'를 곧 출시할 예정입니다.
몇 가지 주요 특징:
• 전용 Google 클라우드 가상 머신에서 실행되므로 컴퓨터를 항상 켜둘 필요 없이 24시간 내내 지속적으로 작동합니다.
Gemini 3.5 및 Antigravity로 구동되는 이 제품은 백그라운드에서 장시간 실행되는 작업을 손쉽게 처리할 수 있습니다.
• 구글 자체 도구를 사용한 통합을 시작으로, 향후 몇 주 내에 MCP를 통해 타사 도구도 통합될 예정입니다.
• Gemini 앱 내에서 상호 작용을 지원하며, 향후 이메일 및 인스턴트 메시지를 통해서도 이용 가능할 예정입니다.
• 안드로이드에서는 올해 말 출시 예정인 새로운 UI 공간인 Android Halo를 통해 에이전트의 실시간 진행 상황을 확인할 수 있습니다.
• 올여름 후반에 Spark는 Chrome에서 직접 실행되어 여러 페이지에서 사용 가능한 에이전트 브라우저가 될 것입니다.
Spark는 이번 주부터 신뢰할 수 있는 테스트 사용자를 대상으로 공개되며, 베타 버전은 다음 주에 미국 내 Google AI Ultra 구독자에게 배포될 예정입니다.
검색, 에이전트 시대로 진입
검색 기능 또한 에이전트로 진화하고 있습니다.
정보 에이전트 : 사용자는 개인 맞춤형 AI 에이전트를 설정하여 백그라운드에서 지속적으로 실행되도록 할 수 있습니다. 이 에이전트는 필요한 정보를 사전에 찾아 적절한 조치를 취하도록 지원합니다. 이 기능은 올여름부터 Google AI Pro 및 Ultra 구독자에게 제공될 예정입니다.
생성형 UI : Gemini 3.5 Flash와 Antigravity를 결합하여, 검색 기능은 각 질문에 대해 개인화된 레이아웃과 인터랙티브 시각 콘텐츠를 포함한 맞춤형 인터페이스를 동적으로 생성합니다. 이 기능은 올여름 모든 사용자에게 무료로 제공될 예정입니다.
영구적인 맞춤형 칸반 보드 : 지속적인 추적이 필요한 장기 작업의 경우, Google 검색을 통해 사용자는 특정 작업에 맞춘 미니 앱과 유사한 맞춤형 칸반 보드 또는 추적 도구를 만들 수 있습니다. 이 기능은 향후 몇 달 내에 미국 내 Google AI Pro 및 Ultra 구독자에게 제공될 예정입니다.
기타 게시된 콘텐츠
일일 브리핑 : 제미니 앱에 곧 기본 제공될 에이전트는 받은 편지함, 캘린더 및 작업을 통합하여 개인 맞춤형 일일 요약을 생성합니다. 정보를 요약할 뿐만 아니라 우선순위를 지정하고, 정리하고, 다음 단계를 제안하여 쉽게 찾아볼 수 있도록 도와줍니다.
Google Flow : 오늘 모든 사용자에게 새로운 에이전트를 출시합니다. 이 에이전트를 통해 사용자는 복잡한 작업을 직접 계획하고 처리하며, 사용자 참여와 제어를 통해 작업을 진행할 수 있습니다. 또한 Flow 내에서 다양한 크리에이티브 도구(예: 비디오 효과 디자인, 손으로 그린 애니메이션, 텍스트 오버레이 도구)를 위한 바이브 코딩을 직접 지원합니다.
Google Pics : 최신 나노 바나나 모델을 기반으로 하는 AI 기반 이미지 생성 및 편집 도구입니다. 이미지의 각 요소를 평면 이미지가 아닌 독립적인 객체로 취급하여 특정 세부 사항을 정밀하게 생성, 교체 및 조정할 수 있습니다. 현재 신뢰할 수 있는 베타 사용자에게 제공되고 있으며, 올여름 후반에 Workspace에서 Google AI Pro 및 Ultra 구독자에게 출시될 예정입니다.
스마트 안경 : 작년 초에 공개된 AI 안경 제품에 대한 자세한 정보가 공개되었습니다. 음성 안내 기능이 있는 오디오 안경과 정보를 표시할 수 있는 디스플레이 안경, 두 가지 유형이 있으며, 두 제품 모두 Gemini 앱을 통해 핸즈프리 사용이 가능합니다. 오디오 안경은 올가을 출시될 예정입니다.
Gemini for Science 는 과학 연구를 위한 AI 도구 모음으로, Gemini의 심층 추론 및 연구 기능인 Deep Think와 Deep Research를 통합하고, Antigravity와 같은 에이전트 플랫폼을 30개 이상의 주요 생명 과학 데이터베이스 및 도구에 연결하는 Science Skills를 추가했습니다. 사용자는 Google Labs에서 Gemini for Science의 실험적 기능을 체험해 볼 수 있도록 신청할 수 있으며, Science Skills는 오늘부터 GitHub와 Antigravity에서 직접 사용할 수 있습니다.
TPU 8i부터 Gemini 3.5, 그리고 Antigravity와 Spark에 이르기까지, 구글은 올해 I/O에서 칩부터 애플리케이션까지 에이전트로 진화하는 완벽한 시스템을 선보였습니다.




