[데일리] Claude Sonnet 5 'Fennec' 출시 — SWE-bench 82.1% 역대 최고
Anthropic이 Claude Sonnet 5(코드명 Fennec)를 공개했습니다. SWE-bench 82.1%로 역대 최초 80% 돌파, Opus 4.5를 능가합니다.
Claude Sonnet 5 'Fennec', 코딩 벤치마크 역사를 다시 쓰다
Anthropic이 Claude Sonnet 5(코드명: Fennec)를 공식 출시했습니다. Vertex AI 에러 로그에서 claude-sonnet-5@20260203이 유출된 후 공식 확인된 이 모델은, AI 코딩 벤치마크의 새로운 기준을 세웠습니다.
핵심 수치
- SWE-bench Verified: 82.1% — 역대 최초 80% 돌파
- 컨텍스트 윈도우: 100만 토큰
- 가격: 입력 $3 / 출력 $15 (100만 토큰당)
- 기존 Opus 4.5의 SWE-bench 78.9%를 능가
왜 중요한가
SWE-bench는 실제 오픈소스 프로젝트의 GitHub 이슈를 AI가 해결할 수 있는지를 측정하는 벤치마크입니다. 80%를 넘겼다는 것은, AI가 실제 소프트웨어 엔지니어링 태스크의 5분의 4 이상을 독립적으로 처리할 수 있다는 의미입니다.
더 놀라운 점은 이 성능이 Opus가 아닌 Sonnet 급에서 달성되었다는 것. 더 빠르고 저렴한 모델이 최상위 모델을 능가하는 현상이 현실화되고 있습니다.
에이전틱 자율성
Sonnet 5는 "에이전틱 자율성(Agentic Autonomy)"을 위해 설계되었으며, Google의 Antigravity TPU 인프라에 최적화되어 거의 제로 레이턴시를 제공합니다.
업계 반응
개발자 커뮤니티에서는 "Sonnet이 Opus를 이기는 시대"에 대한 놀라움과 함께, OpenAI의 대응이 주목받고 있습니다. GPT-5.3 Codex가 며칠 내 출시될 것이라는 소문이 돌고 있습니다.
오늘의 한줄
AI 코딩의 새 시대가 열렸습니다. SWE-bench 80% 돌파는 "AI가 코딩을 도와준다"에서 "AI가 코딩을 한다"로의 전환점입니다.