Recent Developments in LLM Architectures: KV Sharing, mHC, and Compressed Attention
Recent developments in LLM architectures focus on KV sharing, mHC, and compressed attention to improve long-context efficiency.
入选理由:Gemma 4引入KV共享和每层嵌入,优化内存使用。
产品
也叫:Laguna XS2
采用分层注意力预算管理的LLM模型。
已收录 5 篇与「Laguna XS.2」相关的 AI 资讯和分析。
Recent developments in LLM architectures focus on KV sharing, mHC, and compressed attention to improve long-context efficiency.
入选理由:Gemma 4引入KV共享和每层嵌入,优化内存使用。
Poolside AI 发布首款开源权重模型 Laguna XS.2(33B总参/3B激活MoE),Apache 2.0 许可,支持单卡运行,专为智能体编程与长周期任务优化。
入选理由:Laguna XS.2 是 Poolside AI 首个开源权重模型,采用 MoE 架构
Poolside AI 发布开源 MoE 编程模型 Laguna XS.2(33B/3B),专为智能体式前端开发任务优化,支持单卡运行,Apache 2.0 协议。
入选理由:Laguna XS.2 是 Poolside 自研的 33B 总参、3B 激活的稀疏 MoE 编程模型
NVIDIA AI祝贺@poolsideai发布了Laguna XS.2和Laguna M.1,这是Poolside的首个开放权重模型。
入选理由:Laguna XS.2是Poolside的第一个开放权重模型。
该推文仅为 Arena.ai 平台上线 Laguna XS.2 与 M.1 两个前端代码模型的简短通告,无技术细节、评测数据或架构说明。
入选理由:未提供 Laguna XS.2/M.1 的模型能力、训练方法或性能指标
与「Laguna XS.2」经常一起出现的 AI 术语。
💡 想追踪「Laguna XS.2」的长期趋势?去 实体雷达 · Laguna XS.2 查看详细分析和跨材料问答。