| 발표 주체 | Thinking Machines Lab — 미라 무라티가 2025년 2월 설립 |
| 공개물 | 인터랙션 모델(Interaction model) — 사용자를 보고 들으며 실시간 반응하는 AI |
| 현재 상태 | 프리뷰 버전 — 아직 정식 제품(퍼블릭 프로덕트) 아님 |
| 한 줄 정의 | AI가 말하는 도중에도 새 입력을 받아 실시간 반응 |
| 왜 중요한가 | AI 모델만의 변화가 아니라, 그 모델을 쓰는 모든 앱이 재편될 수 있는 사건 |
Thinking Machines가 노리는 것은 더 좋은 모델이 아니라 AI와 사람이 협업하는 방식 자체를 바꾸는 것이다. (첫 제품은 파인튜닝 도구 '팅커(Tinker)', 이번이 인터랙션 모델)
핵심은 "언제 답해야 하는가"의 타이밍을 모델이 스스로 안다는 점이다. 사용자가 생각 중인지, 말을 더 들어야 하는지, 끊어야 하는지를 계속 듣고 보면서 판단한다.
| 구분 | 기존 (ChatGPT Voice·Gemini Live) | 인터랙션 모델 |
|---|---|---|
| 출발점 | 텍스트 → 실시간 기능 추가 | 처음부터 실시간 추구 |
| 입력 처리 | 답 생성 중 새 입력 못 받음 | 말하면서도 계속 입력 받음 |
| 끼어들기 | 가능하나 흐름 깨지면 답 품질 저하 | 흐름을 문맥으로 활용 → 품질 유지 |
| 대화 제어 | 발화 종료·인터럽트 로직 별도 탑재 | 별도 장치 없이 모델이 내장 판단 |
| 턴 단위 | 비교적 긴 턴 | 200ms 단위로 잘게 쪼갬 |
| 처리 방식 | 청크(chunk) 단위 배치 처리 | 스트리밍 처리 |
인터랙션 모델이 보편화되면 앱 구조 자체가 재편된다. 사용자가 그냥 쓰고 있으면 AI가 옆에서 보고 듣다가 필요할 때만 끼어드는 형태가 된다. AI 인프라 경쟁의 '브릿지'에 해당하는 인터페이스를 누가 강하게 쥐느냐의 싸움이 시작됐다.