略读预计 9 分钟

GLM 5.2 Performance Benchmarks

摘要

GLM-5.2（max）是 Z AI 发布的开源权重 MoE 模型（总 753B 参数、40B 激活），支持纯文本输入输出，context window 为 1M tokens，采用 MIT license，可自部署。评测中其 Artificial Analysis Intelligence Index 为 51，显著高于同类模型平均值（约 24），但在同级开源模型中被评价为 “更贵”。性能方面输出速度约 112 tokens/s，属于较快水平，同时 TTFT 约 2.24s。成本上输入 $1.40 / 1M tokens、输出 $4.40 / 1M tokens（均高于同类平均），缓存命中价格 $0.26 / 1M tokens。评测还显示其生成 token 总量约 140M，高于平均水平（约 110M），表现为 “偏 verbose”。整体信息集中在：高智能评分、较高价格、较快生成速度与较高输出冗长度之间的取舍。

荐读理由

GLM-5.2 (max) 在 Artificial Analysis Intelligence Index v4.1 取得 51 分（同类平均 24），生成 140M 输出 tokens（平均 110M），自带 reasoning 机制，在 753B 参数 MoE 架构中仅 40B 活跃；作为开源权重模型支持 1m 上下文和商业使用许可，能让独立开发者判断 AI 工程是否值得深挖。

Hacker News · 137 赞 · 43 评讨论 → 阅读原文 →

这条对你有帮助吗？