← 返回日报
精读 预计 9 分钟

GLM 5.2 Performance Benchmarks

摘要

GLM-5.2(max)是 Z AI 发布的开源权重 MoE 模型(总753B参数、40B激活),支持纯文本输入输出,context window 为1M tokens,采用 MIT license,可自部署。评测中其 Artificial Analysis Intelligence Index 为 51,显著高于同类模型平均值(约24),但在同级开源模型中被评价为“更贵”。性能方面输出速度约 112 tokens/s,属于较快水平,同时 TTFT 约 2.24s。成本上输入 $1.40 / 1M tokens、输出 $4.40 / 1M tokens(均高于同类平均),缓存命中价格 $0.26 / 1M tokens。评测还显示其生成 token 总量约 140M,高于平均水平(约110M),表现为“偏 verbose”。整体信息集中在:高智能评分、较高价格、较快生成速度与较高输出冗长度之间的取舍。

荐读理由

文中给出该模型的关键工程参数(如1M上下文窗口、MoE 753B总参40B激活、112 tok/s速度以及输入/输出定价),这些信息可以直接用于在具体项目中做模型选型与成本-延迟权衡判断,从而影响推理架构与调用策略决策。

Hacker News · 137 赞 · 43 评 讨论 → 阅读原文 →

这条对你有帮助吗?