1개의 리서치
NVIDIA의 Nemotron-H 논문을 분석합니다. Mamba-Transformer 하이브리드 아키텍처가 어떻게 3배 빠른 추론과 동등한 정확도를 달성하는지 살펴봅니다.