AI 주간 뉴스 — GPT-Realtime-2 시리즈, 앤트로픽 SpaceX, 기타 AI 동향

조코딩 JoCoding | 2026-05-12 | 24분 44초
3종GPT Realtime 신모델
70번역 입력 언어
52.5%GPT5.5 환각 감소
5+주요 AI 뉴스
01
OpenAI — GPT Realtime-2 시리즈 3종
GPT Realtime-2

GPT-5급 추론 내장 음성↔음성 모델. 도구 호출(MCP, Function) 지원. 기존 다단계 파이프라인을 단일 모델로 통합.

입력 $32/1M 토큰 · 출력 $64/1M 토큰
GPT Realtime Translate

실시간 통번역 전용. 70개 입력 언어 → 13개 출력 언어. 귀에 꽂고 외국어 행사에서 실시간 통역 가능.

시간 과금 방식 · 시간당 약 ₩2,800~3,000
GPT Realtime Whisper

음성 → 텍스트 전용. 스트리밍 자막 생성. 유튜브 영상 실시간 자막, 회의록 자동화 활용 가능.

오토프레소 오픈소스로 커스텀 구현 가능
02
기존 vs 신규 아키텍처 비교
방식파이프라인특징
기존음성 → STT → GPT-5 텍스트 → TTS → 음성다단계, 레이턴시 높음
신규 Realtime-2음성 → (내부 처리) → 음성단일 모델, 빠른 응답, GPT-5급 추론 내장
03
GPT 5.5 인스턴트 & 기타 뉴스
GPT 5.5 인스턴트
  • GPT 5.5의 속도 개선 버전
  • 환각성 주장 52.5% 감소
  • 부정확한 주장 37.3% 감소
  • 의학·법률·금융 고위험 프롬프트 특히 개선
기타 AI 동향
  • 앤트로픽 (Claude) × SpaceX 계약 체결
  • Gemma 4 MTP — Google 오픈소스 모델 업데이트
  • ERNIE 5.1 — 바이두 AI 신버전 공개
  • Unity AI — 게임 엔진 AI 통합 발표
  • SubQ — 새로운 AI 도구 등장
04
커뮤니티 활용 사례
실시간 자막 + 드로잉

Realtime Whisper로 자막 생성 + 말한 내용을 슬라이드로 실시간 자동 작성. 오토프레소 오픈소스 공개.

음성 코딩 자동화

Realtime-2 + Codex 연동 → 음성 명령으로 코드 자동 작성. "목소리만으로 만들 수 있는 자비스"

유튜브 실시간 번역

크롬 확장 프로그램으로 영상 시청 중 한국어·일본어 실시간 번역 구현.