Fireworks AI 推出 Step 3.7 Flash:从设计出发的 198B 稀疏 MoE 视觉语言模型
Fireworks AI(@FireworksAI_HQ)112 字 (约 1 分钟)
82
Fireworks AI 引入 Step 3.7 Flash:从推理效率出发设计的 198B 稀疏 MoE 视觉语言模型,集成 196B 语言与 1.8B 视觉编码器,实现实际代理任务最高 400 token/s 推理。
入选理由:从设计阶段即优化推理效率,非事后补强。
精选推文#Step3.7 Flash#稀疏 MoE#VLM#198B#400 token/s英文
