AI 주간 뉴스 — GPT-Realtime-2 시리즈, 앤트로픽 SpaceX, 기타 AI 동향

조코딩 JoCoding | 2026-05-12 | 24분 44초

3종GPT Realtime 신모델

70번역 입력 언어

52.5%GPT5.5 환각 감소

5+주요 AI 뉴스

OpenAI — GPT Realtime-2 시리즈 3종

GPT Realtime-2

GPT-5급 추론 내장 음성↔음성 모델. 도구 호출(MCP, Function) 지원. 기존 다단계 파이프라인을 단일 모델로 통합.

입력 $32/1M 토큰 · 출력 $64/1M 토큰

GPT Realtime Translate

실시간 통번역 전용. 70개 입력 언어 → 13개 출력 언어. 귀에 꽂고 외국어 행사에서 실시간 통역 가능.

시간 과금 방식 · 시간당 약 ₩2,800~3,000

GPT Realtime Whisper

음성 → 텍스트 전용. 스트리밍 자막 생성. 유튜브 영상 실시간 자막, 회의록 자동화 활용 가능.

오토프레소 오픈소스로 커스텀 구현 가능

기존 vs 신규 아키텍처 비교

방식	파이프라인	특징
기존	음성 → STT → GPT-5 텍스트 → TTS → 음성	다단계, 레이턴시 높음
신규 Realtime-2	음성 → (내부 처리) → 음성	단일 모델, 빠른 응답, GPT-5급 추론 내장

GPT 5.5 인스턴트 & 기타 뉴스

GPT 5.5 인스턴트

기타 AI 동향

커뮤니티 활용 사례

실시간 자막 + 드로잉

Realtime Whisper로 자막 생성 + 말한 내용을 슬라이드로 실시간 자동 작성. 오토프레소 오픈소스 공개.

음성 코딩 자동화

Realtime-2 + Codex 연동 → 음성 명령으로 코드 자동 작성. "목소리만으로 만들 수 있는 자비스"

유튜브 실시간 번역

크롬 확장 프로그램으로 영상 시청 중 한국어·일본어 실시간 번역 구현.