DeepSeek 的 10 万亿美元大战略
DeepSeek通过多项技术创新大幅降低大模型推理中的KV缓存需求,推动中国AI硬件生态发展,目标打造价值10万亿美元的产业巨兽。
入选理由:DeepSeek V4 Pro仅需5.48GB HBM,相比GLM5的60GB和Qwen3-235B-A22B的89GB显著节省显存
模型
别名:GLM5
智谱AI推出的大型语言模型系列。
已收录 6 条与 GLM 相关的内容,按评分排序。
DeepSeek通过多项技术创新大幅降低大模型推理中的KV缓存需求,推动中国AI硬件生态发展,目标打造价值10万亿美元的产业巨兽。
入选理由:DeepSeek V4 Pro仅需5.48GB HBM,相比GLM5的60GB和Qwen3-235B-A22B的89GB显著节省显存
Claude Code 是 Anthropic 推出的终端 AI 编程助手,支持命令行操作、多模型配置(如智谱 GLM)、Hooks 和工程化工作流。文章提供完整命令大全、高频黄金命令推荐、踩坑记录及最佳实践指南,帮助开发者从入门到精通,显著提升开发效率。
入选理由:使用 `claude -r` 可恢复上次会话,支持按名称或 ID 恢复,适合连续任务处理。
无问芯穹作为中立AI基础设施服务商,支撑国产大模型Token爆发,日均调用量两年增20倍,获近22亿融资,成AGI时代核心枢纽。
入选理由:Agent时代推动单次任务Token消耗飙升至十万甚至百万级,倒逼AI底层架构升级。
Kaku V0.11.0发布,新增对DeepSeek/GLM/Kimi/Fireworks等AI模型的支持,优化会话恢复和终端设置体验,并提升界面与性能稳定性。
入选理由:新增对DeepSeek、GLM、Kimi、Fireworks等AI模型的隐藏推理支持,增强AI编码能力
OpenAI将Codex使用限制降低50%,表明其商业模式难以持续,企业用户受影响较小,个人开发者需寻找替代方案。
入选理由:Codex API调用频率限制已减少一半,用户反馈证实该变化已在持续12小时以上。
Gemini 3.5 Flash 已上线 OpenCode 平台,宣称速度极快、支持 1M 上下文,定价与 GLM、Kimi、DeepSeek Pro 相当,但缺乏技术细节与实测验证,属低信息密度产品公告。
入选理由:Gemini 3.5 Flash 在 OpenCode 平台上线,支持 1M 上下文长度。