2026-06-23 07:06
“GPT-5.5의 1/6 비용으로 코딩 성능은 앞선다.” 2026년 6월, Z.ai(구 Zhipu AI)가 공개한 GLM 5.2에 대한 VentureBeat의 평가입니다. MIT 라이선스 오픈소스로 공개된 744B 파라미터 모델이 어떻게 폐쇄형 최강 모델들을 위협하게 됐는지, 핵심을 파헤쳐 봅니다.
GLM 5.2는 중국 베이징 소재 AI 스타트업 Z.ai(지푸 AI)가 2026년 6월 13일 자사 GLM 코딩 플랜 구독자에게 선공개하고, 6월 16~17일 전 세계에 MIT 라이선스 오픈 웨이트로 공개한 최신 플래그십 모델입니다. GLM-5 패밀리의 세 번째 주요 릴리스로, 전작 GLM-5.1 대비 장기 실행 과제(Long-Horizon Task) 수행 능력을 비약적으로 향상시킨 것이 핵심입니다.
수 시간에 걸친 대규모 코딩 작업, 복잡한 의존성 관리, 다단계 에이전트 루프를 단일 모델이 안정적으로 처리하는 것을 목표로 설계됐습니다. 독립 벤치마크 기관 Artificial Analysis Intelligence Index v4.1에서 오픈 웨이트 모델 1위(51점)를 달성하며 MiniMax-M3, DeepSeek V4 Pro, Kimi K2.6을 앞섰습니다.
GLM 5.2의 성능 비결은 독창적인 아키텍처 설계에 있습니다. 스펙을 단순 나열하는 대신, 어떤 기술이 왜 강력한지를 이해하면 실제 활용 시 차별점이 보입니다.
총 744B(일부 표기 기준 753B) 파라미터이지만 토큰당 활성 파라미터는 약 40B에 불과합니다. 추론 시 전체 전문가(Expert) 중 일부만 활성화하는 방식으로, 이 규모의 모델치고는 서빙 비용이 현실적인 이유입니다.
GLM 5.2의 가장 주목할 만한 기술 혁신입니다. 기존 희소 어텐션(DSA)은 레이어마다 별도의 인덱서를 연산했지만, IndexShare는 4개 레이어마다 단일 경량 인덱서를 공유합니다. Z.ai 발표 기준 1M 토큰 컨텍스트에서 토큰당 연산량(FLOPs)을 2.9배 절감합니다. 긴 문서나 대형 코드베이스를 다룰 때 속도와 비용이 동시에 유리해지는 이유입니다.
투기적 디코딩(Speculative Decoding)을 구동하는 MTP 레이어도 강화됐습니다. 여러 토큰을 미리 예측하고 병렬로 검증하는 방식으로 수락 토큰 길이를 최대 20% 향상시켜, 도구 호출이 빈번한 에이전트 루프에서 체감 속도가 눈에 띄게 빨라집니다.
요청별로 High(빠른 일반 생성)와 Max(심층 다단계 코딩·설계 작업) 두 가지 추론 강도를 선택할 수 있습니다. 모델 자체를 바꾸지 않고 필요에 따라 품질-속도 균형을 조절하는 실용적인 설계입니다.
핵심 스펙 요약
| 항목 | 사양 |
|---|---|
| 총 파라미터 | 744B (MoE) |
| 활성 파라미터 | ~40B/토큰 |
| 컨텍스트 창 | 1,048,576 토큰 (≈ 1M) |
| 라이선스 | MIT (완전 무료·상업적 이용 가능) |
| 출력 형식 | 텍스트, 도구 호출, JSON, 스트리밍 |
| 추론 모드 | High / Max |
GLM 5.2가 설계 목표로 삼은 장기 코딩 에이전트 영역에서의 결과입니다.
단, 멀티모달 입력은 지원하지 않습니다. 이미지·영상 처리가 필요하다면 동일 Z.ai 라인업의 GLM-5V-Turbo(Design2Code 94.8점)를 병행 사용하는 것이 권장됩니다.
GLM 5.2의 가장 강력한 무기 중 하나는 압도적인 비용 효율입니다.
| 모델 | 입력 (1M 토큰) | 출력 (1M 토큰) |
|---|---|---|
| GLM 5.2 (Z.ai 공식) | $1.40 | $4.40 |
| GPT-5.5 | ~$8~9 (추정) | ~$24~27 (추정) |
| Claude Opus 4.8 | 참고용 폐쇄형 | — |
로컬 실행 시 주의: 전체 가중치를 실행하려면 256GB 이상의 VRAM(또는 CPU RAM+VRAM 혼합)이 필요합니다. 개인 PC에서는 사실상 불가능하며, 양자화(Quantized) 버전이나 Ollama의 소형 버전을 사용하는 것이 현실적입니다.
출시 이후 국내외 개발자 커뮤니티와 전문 매체의 반응을 종합했습니다.
| 항목 | GLM 5.2 | Claude Opus 4.8 | GPT-5.5 | DeepSeek V4 Pro |
|---|---|---|---|---|
| 라이선스 | MIT 오픈 | 폐쇄형 | 폐쇄형 | 오픈 |
| 컨텍스트 | 1M 토큰 | 200K | 128K | 128K |
| SWE-bench Pro | 62.1 | 최상위 | 비공개 | — |
| AA Index | 51점 (1위) | — | — | 44점 |
| 입력 API 단가 | $1.40/1M | ~$15/1M | ~$9/1M | ~$2/1M |
| 멀티모달 | ✗ | ✓ | ✓ | ✗ |
GLM 5.2는 모든 AI 사용자에게 최선은 아닙니다. 목적에 맞게 판단하세요.
오픈소스 AI의 역사에서 “폐쇄형 모델의 코딩 성능을 따라잡은” 이정표적 모델로 기록될 가능성이 높습니다. MIT 라이선스라는 점은 특히 강력합니다. 상업적 이용, 수정, 재배포 모두 자유롭기 때문에, GLM 5.2를 기반으로 한 파생 모델과 서비스가 쏟아질 가능성이 높습니다. OTA 방식의 지속적 개선이 이어진다면, 시간이 지날수록 가성비는 더욱 높아질 것입니다.