SPACEBARSpacebarAI Research
데일리 뉴스··5 min read·SpacebarAI

[데일리] Qwen3.5-9B가 120B를 이겼다, 연방 AI 조달 기한 임박

Alibaba Qwen3.5-9B가 OpenAI gpt-oss-120B를 벤치마크에서 앞섰습니다. 미국 연방 AI 조달 정책 기한이 이틀 앞으로 다가왔습니다.

Alibaba Qwen3.5-9B, 120B 모델을 벤치마크에서 압도

Alibaba의 Qwen 팀이 3월 2일 공개한 Qwen 3.5 Small Model Series가 주목받고 있습니다. 0.8B, 2B, 4B, 9B 네 가지 크기로 출시된 이 시리즈 중 최상위 모델인 Qwen3.5-9B가 OpenAI의 오픈소스 모델 gpt-oss-120B(파라미터 13배 이상)를 주요 벤치마크에서 앞질렀습니다.

벤치마크 Qwen3.5-9B gpt-oss-120B
GPQA Diamond 81.7 71.5
HMMT Feb 2025 83.2 76.7
MMMU-Pro 70.1 59.7
ERQA 55.5 -

핵심은 아키텍처의 전환입니다. Qwen3.5는 기존 트랜스포머 대신 Gated Delta Networks(선형 어텐션)와 sparse MoE를 결합한 Efficient Hybrid Architecture를 채택했습니다. 덕분에 일반 노트북에서도 구동이 가능합니다.

9B 파라미터로 120B를 이기는 결과는 "모델은 클수록 좋다"는 통념에 정면으로 반하는 사례이며, 온디바이스 AI의 실용성을 입증한 것으로 평가됩니다.


미국 연방 AI 조달 정책, 3월 11일 기한

백악관 예산관리국(OMB)이 지난해 12월 발표한 M-26-04 지침의 이행 기한이 3월 11일로 이틀 앞으로 다가왔습니다. 이 지침은 트럼프 대통령의 "Preventing Woke AI" 행정명령을 구체화한 것입니다.

핵심 요구사항은 다음과 같습니다.

  • 모든 연방 기관은 LLM 조달 시 모델 카드, 평가 자료, 이용 정책을 공급업체에 요청해야 합니다
  • 기존 계약도 "실행 가능한 범위 내에서" 수정해야 합니다
  • "진실 추구(truth-seeking)"와 "이념적 중립(ideological neutrality)" 원칙 준수가 의무화됩니다

이 지침은 배포 방식에 관계없이 모든 조달 LLM에 적용됩니다. AI 기업 입장에서는 연방 시장 진입을 위해 모델 투명성 문서를 갖춰야 하는 새로운 기준이 생긴 셈입니다.


Samsung, Gemini AI 탑재 기기 8억 대 목표

Samsung Electronics가 2026년 말까지 Google Gemini AI를 탑재한 모바일 기기를 8억 대로 늘리겠다고 밝혔습니다. 2025년 말 기준 약 4억 대에서 두 배로 확대하는 목표입니다.

TM Roh 사장은 "모든 제품, 모든 기능, 모든 서비스에 AI를 최대한 빠르게 적용하겠다"고 밝혔습니다. 스마트폰과 태블릿을 넘어 TV, 가전까지 확장 범위에 포함됩니다.

이는 Apple이 Siri에 Gemini를 도입하려는 움직임과 맞물려, Google이 자체 Pixel 외에도 Samsung과 Apple이라는 양대 하드웨어 파트너를 통해 Gemini 생태계를 급속히 확장하고 있음을 보여줍니다. Galaxy AI 브랜드 인지도는 12개월 만에 30%에서 80%로 급등한 것으로 알려졌습니다.


핵심 요약

  • Alibaba Qwen3.5-9B가 하이브리드 아키텍처로 120B 모델을 벤치마크에서 앞섰으며, 소형 모델의 효율성 혁신이 가속화되고 있습니다
  • 미국 연방 AI 조달 정책 M-26-04의 이행 기한(3/11)이 임박하면서, AI 기업의 모델 투명성 문서화가 시장 진입 조건이 되고 있습니다
  • Samsung이 Gemini AI 기기 8억 대를 목표로 하면서, Google의 AI 생태계가 하드웨어 파트너십을 통해 빠르게 확산 중입니다

관련 리서치