Step 3.7 Flash:专为推理优化设计的 196B MoE 模型
Fireworks AI(@FireworksAI_HQ)183 字 (约 1 分钟)
85
Step 3.7 Flash 是一个专为推理优化设计的 196B MoE 模型,采用 MFA 和 AFD 技术,KV-cache 占用仅为 DeepSeek 的 22%,支持高效代理、编码和多模态任务,已开源并可在 Fireworks 平台使用。
入选理由:Step 3.7 Flash 是 196B MoE 模型,从设计之初就聚焦推理效率,而非事后优化。
精选推文#Step 3.7 Flash#MoE#推理优化#Fireworks AI#Apache 2.0英文
