1
핵심 개요 — 경쟁의 축이 바뀌었다
0:02
| 항목 | 내용 |
| 현장 | 구글 IO 2026 발표 현장. 검색 책임자 부수장에게 직접 질문할 기회도 있었음 |
| 핵심 주장 | "지금까지의 AI 모델 경쟁(누가 더 똑똑한가)은 끝났다." 이제 속도·효율성·상업화가 경쟁의 축 |
| 지능은 전제 | 높은 지능은 당연한 기본값이 되고, 그 위에서 얼마나 빠르고 싸게 굴리느냐가 승부처 |
| 구글의 의도 | "부자만 가능한 싸움"으로 판을 옮겨 자체 칩(TPU)을 가진 구글이 유리한 전장을 만듦 |
2
핵심 발표 — Gemini 3.5 Flash
0:59
Flash 모델: 전작 프로(Pro)급 성능을 훨씬 빠른 속도로 굴리는 경량 모델. 토큰(AI가 처리하는 정보 단위)을 빠르게 쏟아낸다.
전작 프로를 능가
경량 Flash인데도 이전 세대의 고성능 Pro 모델을 성능에서 다 이김.
압도적 속도
초당 약 289토큰 출력. 다른 프론티어 모델 대비 네 배가량 빠름.
12배 효율
내부적으로는 같은 품질을 12배 빠르게 내는 추론 품질도 있다고 임원이 언급.
왜 빠른 모델이 필요한가: AI 글래스(안경형 기기) 때문. 눈에 보이는 걸 물으면 즉시, 그러나 틀리지 않게 답해야 하므로 속도와 품질의 균형이 관건이다.
3
기술적 맥락 — 8세대 TPU의 분리
3:48
TPU(Tensor Processing Unit): 구글이 직접 만든 AI 전용 칩. 8세대부터 용도에 따라 둘로 쪼개졌다.
TPU8T — 학습용
- AI 모델을 훈련(학습)시킬 때 사용
- 대규모 연산으로 모델을 새로 만드는 단계
TPU8i — 추론용
- 완성된 모델이 답변(추론)할 때 사용
- 가격 대비 성능이 전작 대비 +80%
왜 분리가 중요한가: 그동안 여러 AI 회사는 모델 학습에 박차를 가할 때 추론용 컴퓨팅 자원을 끌어다 써, 특정 기간 답변 품질이 떨어지거나 오류가 났다. 구글은 칩 단계에서 학습·추론 자원을 완전히 분리해 답변 시 컴퓨팅 파워를 구조적으로 보장한다.
4
전략적 의미 — 추론 비용 경쟁의 승자
4:44
추론 비용: AI가 답변할 때마다 드는 연산 비용. 사용자가 많아질수록 어마어마하게 누적된다.
핵심: 글래스를 끼면 단순한 질문을 수십 개씩 던지게 된다. 이런 대량의 가벼운 질문에 답하는 연산 비용 경쟁에서, 자체 칩을 가진 구글은 더 싸게 더 많이 공급할 수 있어 다른 기업이 이기기 어려운 판이 만들어졌다.
5
경쟁 환경 — 글래스와 검색의 변화
6:38
AI 글래스
- 반응 속도가 실시간에 가까움(체험 인상)
- 안드로이드·애플 iOS 모두에서 작동
- 입력이 한정적이라 명령 1번에 끝까지 자율 수행이 중요
- 젠틀몬스터·와비파커 신제품은 없었고 작년과 동일 하드웨어
구글 검색의 전환 (25년 만)
- AI 친화적 UI/UX로 검색 경험 재설계
- 필요한 정보를 즉석에서 생성해 보여줌
- 검색·구매·장바구니가 한 자리에서 통합
- 가격 이력 등 쇼핑 데이터도 알아서 제공
01
글래스 일상 검색
눈에 보이는 사물을 즉시 질문. 빠르고 한정적 입력에 맞춰 AI가 끝까지 자율 수행해 결과를 내준다.
02
검색→구매 통합
검색·장바구니·가격 이력이 한 화면에서 연결돼, 정보 탐색에서 구매까지의 동선이 짧아진다.
03
대량 경량 질의 서비스
초당 수백 토큰·저비용 추론을 무기로, 사용자 수십만이 가벼운 질문을 쏟아내는 서비스를 저가에 공급.
요지: 구글 IO 2026은 AI 경쟁의 무게중심을 "더 똑똑한 모델"에서 "더 빠르고 싼 모델"로 옮긴 분기점이다. 자체 칩(TPU)으로 학습·추론을 분리해 답변 품질과 원가를 동시에 잡은 구글은, 글래스·검색 등 대량 경량 질의가 폭증할 영역에서 구조적 우위를 확보했다. 엔비디아 칩에 의존하는 경쟁사들은 추론 원가 경쟁에서 불리해지는 국면이다.