GLM-5 | Lab Index

Most powerful Z.ai model family. GLM-5 is 744B total params (44B active) via MoE with 256 experts. Hybrid Attention and Multi-Token Prediction. First frontier-scale model trained entirely on 100,000 Huawei Ascend 910B chips. GLM-5-Turbo is the fast variant optimized for the OpenClaw agent ecosystem.

Blog Post Paper (arXiv)GitHub HuggingFace Announcement (Turbo)API Docs Artificial Analysis (article)Artificial Analysis OpenRouter

Outputs 3

GLM-5: From Vibe Coding to Agentic Engineering

model

744B total params (44B active) via MoE with 256 experts. Hybrid Attention and Multi-Token Prediction. First frontier-scale model trained entirely on 100,000 Huawei Ascend 910B chips (zero American hardware).

Blog Post GitHub HuggingFace

Architecture MOE

Parameters 744B

Active params 44B

Training tokens 28.5T

AA Intelligence 50

GLM-5 Technical Report

paper

Paper (arXiv)

arXiv HTML

GLM-5-Turbo

model 2026-03-16

Specialized "fast" version optimized for the OpenClaw agent ecosystem, focusing on continuous task execution and tool reliability.

Announcement API Docs OpenRouter

Architecture MOE

moeagenticcodingfrontierefficiency