SPACEBARSpacebarAI Research

#AGI

1개의 리서치

리서치·2026-02-21·6 min read

[리서치] ARC-AGI-2 벤치마크와 AI 추론 능력의 미래

Gemini 3.1 Pro가 77.1%를 달성한 ARC-AGI-2는 어떤 벤치마크이며, AI의 '진짜 추론' 능력을 어떻게 측정하는지 심층 분석합니다.