01핵심 개요
| 항목 | 내용 |
|---|
| 채널 | 안될공학 |
| 소재 | GTC 타이페이 젠슨황 키노트 현장 해설 |
| 핵심 명제 | "Compute is revenue" — AI는 비용이 아니라 매출을 찍어내는 인프라 |
| 전환 | 경쟁이 모델 성능표 밖으로 이동 → 누가 더 싸게·많이·안정적으로 AI로 돈 벌게 하느냐 |
| 결론 | GPU 전쟁 → "AI 팩토리(공장) 전쟁" — 주변 병목 전체를 NVIDIA가 직접 설계 |
02핵심 내용 구조 — 공장 비유로 본 발표
| 구성 | 역할 | 발표 제품/사례 |
|---|
| 두뇌(GPU) | 추론·생성 핵심 연산 | Vera Rubin (Grace Blackwell 대비 에이전트 처리량 10배) |
| 작업 조율(CPU) | 에이전트 다중 실행·데이터 공급 | Vera CPU (x86 대비 에이전틱 1.8배, NYSE 1.1조 메시지/일) |
| 신경망(네트워크) | GPU 간 초고속 통신 | Spectrum-X 이더넷 포토닉스/CPO (전력효율·업타임 5배) |
| 관문(보안) | 데이터 격리·권한 통제 | BlueField-4 DPU |
| 운영체계 | 공장 전체 관리 | DGX |
| 검증 사례 | 자율 칩 설계 검증 | Cadence 칩스택 AI 슈퍼에이전트(검증 5주→하루 미만) |
03기술적 맥락
- AI 팩토리: 저장 창고가 아니라 토큰·결과물을 찍어내는 공장. 전기를 넣으면 24시간 매출을 생산. 딥링크 1:42
- 에이전트 = LLM + 하네스: 두뇌(추론·계획)에 메모리·툴 호출·권한·샌드박스·검증 루프가 붙어야 일을 돌리는 에이전트가 됨.
- 병목 이동: 하나의 프롬프트가 수천 단계 여정(retriever→tool→generation)으로 확장 → 병목이 GPU 밖(CPU·네트워크·보안)으로 분산. 딥링크 7:01
- Vera CPU: 88코어, OoO SMT, 최대 1.2TB/s LPDDR5X, NVLink C2C 코히어런트 — 파이썬 기반 에이전트 오케스트레이션의 GPU 발목잡기 방지. 딥링크 0:59
04전략적 의미
- NVIDIA는 "더 빠른 칩 파는 회사"라는 정체성을 버리고 돈이 만들어지는 생산라인 전체를 설계하는 회사로 포지셔닝.
- Vera CPU는 GPU 대체가 아니라 GPU가 더 오래·바쁘게·수익성 있게 일하도록 만드는 보조 장치.
- 로봇: Isaac GR00T 레퍼런스 휴머노이드(Unitree H2+ 바디, Sharpa 손, Jetson Thor) — 완제품이 아닌 "로봇 산업의 두뇌·신경계 플랫폼" 선점. 딥링크 13:46
05핵심 포인트 비교 — 관점 전환
| 기존 관점 | 키노트가 제시한 관점 |
|---|
| 데이터센터 = 서버 창고 | AI 팩토리 = 매출 생산 공장 |
| GPU가 유일한 핵심 | GPU·CPU·네트워크·보안 전체가 생산 설비 |
| 컴퓨팅 = 비용 | 컴퓨팅 = 매출(compute is revenue) |
| PC 기준 = CPU·배터리 | PC 기준 = 로컬 에이전트 구동력(RTX 스파크) |
06활용 시나리오 (투자·산업 시사점)
- 반도체 검증: AI 에이전트가 이메일 작성을 넘어 칩 설계·검증 등 고부가 엔지니어링으로 진입(Cadence).
- 금융 인프라: NYSE가 Vera CPU로 초저지연 마켓 인프라 확장 — 안정성·지연이 핵심.
- 로컬 PC AI: RTX 스파크로 프라이버시 중요 작업을 PC 내 로컬 에이전트로 수행(MS·Dell·HP·Lenovo 생태계).
07현황 및 전망
- 지켜볼 포인트: Vera Rubin 실제 양산·공급, Vera CPU의 엔터프라이즈 채택 속도, Cadence류 에이전트 신뢰성, CPO/Spectrum-X 실제 배치.
- 대만 서플라이체인이 반복 강조 — AI 팩토리는 칩 하나가 아닌 서버·냉각·전력·네트워크·제조 전체가 결합돼야 작동.
- 과장 경계: 레퍼런스 디자인이 곧 대량 상용화는 아니며, 로봇 대중화도 내년 즉시는 아님. 다만 피지컬 AI 플랫폼 주도권 경쟁은 이미 시작.
08용어 사전
| 용어 | 한줄 설명 | 비유/예시 |
|---|
| AI 팩토리 | 토큰·결과물을 찍어내 매출을 만드는 AI 인프라 | 전기를 넣는 24시간 공장 |
| Compute is revenue | 컴퓨팅이 비용이 아니라 매출이라는 명제 | 기계가 돌수록 돈이 나옴 |
| 하네스(harness) | LLM 두뇌를 일하게 만드는 주변 장치 묶음 | 두뇌에 붙는 손발·기억 |
| Vera CPU | 에이전트용으로 설계된 NVIDIA의 첫 CPU | 공장의 작업 반장 |
| CPO | 광모듈을 스위치 칩에 밀착시킨 광통신 방식 | 전선 대신 빛으로 배달 |
| BlueField DPU | 데이터 길목에서 보안·격리를 담당하는 장치 | 공장 출입 검문소 |
| Isaac GR00T | 휴머노이드 로봇용 소프트웨어·모델 스택 | 로봇의 두뇌 OS |