T
traeai
Sign in

模型

GLM-5

通义千问系列大模型

已跟踪 2 条高相关材料

TraeAI 观察

相关材料

已收录 2 条与 GLM-5 相关的内容,按评分排序。

We ran 720 browser agent tasks with @nottecore across frontier models. 

One baseline model produced...

Fireworks AI on X: We ran 720 browser agent tasks with @nottecore across frontier models

Fireworks AI(@FireworksAI_HQ)236 字 (约 1 分钟)
85

Fireworks AI tests show baseline models had 20% retry rates in browser agent tasks, while Kimi K2.5/GLM-5/MiniMax M2.5 achieved near-zero retries with stable latency, directly impacting production system costs/delays/reliability.

入选理由:基线模型在5次调用中约1次输出畸形,导致多步骤工作流重试

FeaturedTweet#Fireworks AI#Browser Agents#Model Execution#Retry Rates#Cost Optimization英文
智谱公布“降智”的秘密:Scaling不可避免的痛

智谱公布“降智”的秘密:Scaling不可避免的痛

量子位1854 字 (约 8 分钟)
85

智谱技术博客揭示了在大规模Coding Agent推理过程中遇到的"Scaling Pain",包括乱码、复读和生僻字等异常现象,通过深入排查发现这些问题源于高负载下的推理状态管理不当。文章分享了投机采样作为异常检测指标的策略,以及修复KV Cache竞态和HiCache加载时序问题的具体方案,并提出了Prefill阶段的LayerSplit优化来缓解内存与带宽压力,最终显著提升了系统性能。

入选理由:智谱遭遇的异常现象(乱码、复读、生僻字)根源在于高负载推理状态管理问题。

FeaturedArticle#智谱#GLM-5#Scaling Pain#推理引擎#Coding Agent中文

跨材料问答 · GLM-5

回答基于:GLM-5 相关 2 条材料
    0 / 500

    AI may generate inaccurate information. Please verify important content.