01핵심 개요
| 항목 | 내용 |
|---|---|
| 주제 | Opus 4.8의 정직성·규칙 준수 강화가 작업 방식을 바꿈 |
| 사용 맥락 | Remotion(코드로 영상 제작) — 수십 개 규칙을 박아야 하는 환경 |
| 핵심 반전 | "규칙 적게 주기"가 미덕이었으나 → "규칙 자세히 주기"가 효과적 |
02두 가지 변화
1
환각 감소모르는 건 '모르겠다'고 보류하는 방식으로 오답률 최저. 자기 코드 결함을 말없이 넘기는 경우가 이전보다 약 4배 감소(Anthropic 자료).
2
규칙 준수예전엔 규칙 절반이 무시됐으나, 4.8은 빡빡한 규칙을 정확히 지키며 에러 없이 동작. 안 되는 부분은 "이래서 안 되니 이렇게 바꾸겠다"고 이유를 설명하고 방향 전환 → 협업이 됨.
신입 직원 비유: 모르면서 아는 척하는 동료보다, 막히면 "이 부분 확실하지 않은데 확인해 주실래요?"라고 묻는 동료가 함께 일하기 편함.
03설계 철학과 트레이드오프
| 측면 | 내용 |
|---|---|
| 철학 | "추측하느니 거부하라" — 모르면 답하지 않도록 보정(4.7도 이미 환각률 낮음) |
| 단점 | 추측을 안 해 답을 적게 할 때가 있음("잘 모르겠어요"가 많을 수 있음) |
| 적합 영역 | 코드 작성·규칙 준수·실수 불가 작업에서 우월 |
04권장 사용법
1
규칙을 자세히"알아서 잘해 줘" 대신 규칙·제약·하지 말 것을 최대한 적어줄 것. 잘 적은 규칙 문서가 자산이 됨.
2
AI 질문에 응답"이거 확실하지 않은데요"라고 물으면 귀찮아하지 말 것. 아는 척 사고치는 것보다 100배 나음.
05의미
뻑뻑하게 규칙 걸고 일하는 사람에게 이 변화는 점수 몇 점보다 크게 체감 — 에러 잡던 시간이 사라짐. Anthropic은 4.8을 "더 효과적인 협업자"로 표현.
06용어 사전
| 용어 | 한줄 설명 | 비유/예시 |
|---|---|---|
| 환각(Hallucination) | AI가 모르는 걸 아는 척 지어내는 것 | 모르면서 당당히 틀린 답 |
| 정직성 보정 | 불확실하면 답을 보류하도록 설계한 것 | 모르면 손드는 학생 |
| Remotion | 코드로 영상을 만드는 도구 | 자막·전환을 프로그래밍 |