SpacebarAI Research

#SWE-bench

3개의 리서치

리서치·2026-02-07·6 min read

[리서치] AI 코딩 에이전트의 진화 — Copilot에서 자율 개발까지

2022년 GitHub Copilot 출시부터 2026년 SWE-bench 80% 돌파까지, AI 코딩 에이전트가 어떻게 진화해왔는지 기술적 관점에서 분석합니다.

데일리 뉴스·2026-02-03·3 min read

[데일리] Claude Sonnet 5 'Fennec' 출시 — SWE-bench 82.1% 역대 최고

Anthropic이 Claude Sonnet 5(코드명 Fennec)를 공개했습니다. SWE-bench 82.1%로 역대 최초 80% 돌파, Opus 4.5를 능가합니다.

인사이트·2026-02-03·4 min read

[인사이트] SWE-bench 80% 돌파가 소프트웨어 산업에 의미하는 것

Claude Sonnet 5가 SWE-bench 82.1%를 기록했습니다. AI 코딩 모델이 실제 개발 업무의 80% 이상을 처리할 수 있게 된 시점에서, 소프트웨어 산업은 어떻게 변할까요?