조코딩 JoCodingMORNING DIGEST · 2026-06-08 · 조코딩 JoCoding🎬 영상
조코딩 IT뉴스 — 앤트로픽 재귀적 자기개선 · 컴퓨텍스 · MS Build · 모델 러시
title: "조코딩 IT뉴스 — 앤트로픽 재귀개선·컴퓨텍스·MS Build 총정리"
01핵심 개요
| 주제 | 핵심 |
|---|
| 앤트로픽 RSI | AI가 다음 세대 AI를 개발하는 재귀적 자기개선 시대 임박 경고 |
| 컴퓨텍스 | 엔비디아 RTX Spark(윈도우용 AI PC 칩) + Nemotron 3 Ultra 등 오픈모델 |
| 젠슨황 한국 | 한국 AI 기술센터 설립, 삼겹살 회동, 서울대 빌더 클로우 행사 |
| MS Build | 신모델 7종(MAI Thinking 1 등) + OpenClaw 윈도우 공식 협업 |
| 구글 | Gemma 4 12B, QAT 양자화 모델, NotebookLM 파일 생성 |
| OpenAI | Sites(원클릭 배포), iOS 앱 빌드, Gmail 연동, Dreaming 메모리 |
| 오픈웨이트 러시 | Ideogram 4.0, MiniMax M3, BAGEL, 다수 TTS, 로봇 데모 |
02보안 사고 + 앤트로픽 RSI
- 메타 취약점: 계정 복구에서 Meta AI에게 이메일 교체 지시 → 인증코드 가로채기로 오바마 등 유명 계정 탈취 가능(현재 패치) — "고객과 뚫린 AI에 과도한 권한 금지" 교훈
- 앤트로픽 블로그 "AI가 스스로를 구축할 때": RSI(recursive self-improvement) — AI가 다음 세대 AI를 직접 설계·학습·평가
- 발전 3단계: ①인간이 만듦 → ②AI가 인간을 도움(현재) → ③AI가 다음 AI를 만듦(임박)
- 위험: 인간이 AI 개발 중심에서 밀려남(병목 회피 위해 감시 축소), 모델 동작 불가해
- 제안: 글로벌 검증가능 일시정지 체계 — 단 경제·경쟁(중국) 현실상 실효성 의문
- 다리오 아모데이·클로드 코드 창시자 보리스: "루프만 만들면 프롬프트조차 안 준다" 발언으로 뒷받침
03컴퓨텍스 — 엔비디아
- RTX Spark: 윈도우용 통합칩(GPU+CPU), DGX Spark의 GB10과 사실상 동일 스펙의 윈도우 대중화 버전
- 화자 실사용 평가: LPDDR 기반 유니파이드 메모리라 큰 모델 적재 가능하나 속도 답답 → 헤비 코딩엔 결국 클라우드 회귀, 방향성은 명확하나 "지금은 아니다", 추정가 3,000~7,000달러
- Nemotron 3 Ultra: 550B MoE 오픈소스 모델, GLM·Kimi·Qwen 등 대형 오픈소스 대비 상위권
- 추가 오픈소스: Cosmos 3(물리 AI), Alpamayo 2 Super(자율주행 32B), Nemotron 3.5 ASR Streaming(40개 언어, 80ms)
04젠슨황 한국 방문
- 홍대 T1 베이스캠프 PC방 방문, 페이커에게 RTX 5090 선물
- 삼겹살 회동: 최태원(SK)·이해진(네이버)·구광모(LG) — HBM·데이터·로봇 협력 시사
- "4가지 사업 선물" 중 한국 AI 기술센터(물리 AI 거점) 설립, 채용 공고 게시
- 서울대 "빌더 클로우" 행사(8일) 방문 예정 — 박사급 인재 채용 관계 구축
05MS Build
- 신모델 7종: 이미지/이미지 플래시/트랜스크라이브/씽킹/보이스/보이스 플래시/코드 플래시
- MAI Thinking 1: 플래그십 추론 모델, 성능은 Sonnet 4.6~Opus 4.6 사이(수학 97점)
- MAI Image 2.5: 이미지 에디팅 아레나 2위(나노바나 상회), MAI Transcribe 1.5: 43개국어 1위·1시간 오디오 15초 전사
- OpenClaw × MS 공식 협업: 윈도우 내에서 안전하게 OpenClaw 기본 제공(오픈소스 유지) — 사무직 접근성 대폭 향상
- MS Scout: 항상 작동하는 오토파일럿 에이전트(Teams·Outlook·OneDrive 모니터링)
- 유출: 슬라이드에서 클로드 미소스(Mithos) 학습 컴퓨팅 파워 노출
- GitHub Copilot 사용량 기반 요금제 전환(6/1~) — 요금 폭탄 주의
06구글 · OpenAI
- 구글 Gemma 4 12B: 중간급 멀티모달(유니파이드 트랜스포머), 16GB램 랩탑 구동
- Gemma 4 QAT: 양자화 인식 훈련 → 4비트에서 메모리 72%↓ 거의 원본 성능 유지
- NotebookLM: PDF·텍스트·마크다운·docx 등 다양한 파일 생성 지원
- 스페이스X-구글: 구글이 AI 인프라 부족으로 스페이스X에서 GPU 11만 개 임대(월 9.2억 달러, 약 1.2조원)
- 구글 쇼핑 AI 옷 입혀보기(나노바나 기반) 한국 출시 / Magenta RealTime 2 실시간 음악 생성 오픈소스
- OpenAI Sites: 코덱스에서 프롬프트로 웹사이트 즉시 배포(chatgpt.site) — "AI 웹빌더 스타트업 킬러"
- 코덱스 iOS 앱 빌드(시뮬레이터 연동), Gmail 연동(맥락 반영 답장·전송), Dreaming 메모리(팩추얼 리콜 31%→83%)
07오픈웨이트 러시 · 로봇 · WWDC 전망
- Ideogram 4.0: 오픈웨이트 이미지 모델(글씨·필기체 강함, 단 논커머셜 라이선스)
- LIBV 2.0: 4K 클로즈소스 이미지, 아레나 2위 / BAGEL: Gemini 옴니의 오픈소스 버전(바이트댄스)
- TTS 대량 출시: Higgs V3(100개 언어·감정표현), Alibaba FunReal-Time(리더보드 1위), Wave TTS(제로샷 음성복제), Maya1
- Alibaba 캐릭터 스트림: 싱글 GPU 실시간 스트리밍 영상(라이브 커머스 활용)
- MiniMax M3: 오픈웨이트 종합 1위(Gemini 3.5 Flash 다음), 1M 컨텍스트 네이티브 멀티모달
- 로봇: 유니트리 복싱 로봇(실측 위협적), 실시간 텔레오퍼레이션 군무, UBTECH 바이오닉 휴먼노이드
- WWDC(다음 주): 애플용 1.2T Gemini 온디바이스 탑재 가능성 — 화요일 새벽(한국시간) 공개
08용어 사전
| 용어 | 한줄 설명 | 비유/예시 |
|---|
| RSI(재귀적 자기개선) | AI가 다음 세대 AI를 스스로 개발하는 루프 | 스승이 더 뛰어난 제자를 길러내는 반복 |
| RTX Spark | 엔비디아의 윈도우용 통합 AI PC 칩 | DGX Spark의 윈도우 대중화 버전 |
| 유니파이드 메모리 | CPU·GPU가 함께 쓰는 통합 메모리 | 칸막이 없는 공용 작업대 |
| MoE | 부분 전문가만 활성화하는 대형 모델 구조 | 질문마다 담당 전문가만 호출 |
| QAT(양자화 인식 훈련) | 양자화 후 성능 저하를 줄이는 훈련법 | 압축될 걸 미리 알고 연습한 가수 |
| 오픈웨이트 | 가중치를 공개해 직접 실행 가능한 모델 | 무료로 받아 쓰는 엔진 |
| OpenClaw | AI 에이전트 오케스트레이션 프레임워크 | 여러 AI를 지휘하는 지휘자 |
| TTS | 텍스트를 음성으로 변환하는 기술 | 글을 읽어주는 성우 |
| 텔레오퍼레이션 | 사람 동작을 로봇이 실시간 따라하기 | 인형극의 줄 조종 |
| 제로샷 음성복제 | 짧은 샘플만으로 목소리를 복제 | 4초 듣고 성대모사 |