概念

Sparse Attention

Q: Sparse Attention 最近有什么新动态？

traeai 已收录 1 篇与 Sparse Attention 相关的内容。最新一篇是「.@MiniMax_AI M3 model is available on Ollama's Cloud! In partnership with MiniMax, the M3 model on...」，由 ollama(@ollama) 发布。

别名：稀疏注意力

一种优化 Transformer 架构的技术，可大幅扩展上下文长度而不显著增加计算成本。

已跟踪 1 条高相关材料

TraeAI 观察

如果只读 3 篇

.@MiniMax_AI M3 model is available on Ollama's Cloud! In partnership with MiniMax, the M3 model on...

ollama(@ollama) · 7.5 分

MiniMax M3 模型已上线 Ollama Cloud，支持 US 基地部署与零数据保留，专为编码和代理任务优化，在 SWE-Bench Pro 等基准中达 59%+ 分数，结合稀疏注意力实现 1M 上下文长度。

MiniMax M3 Model Now Available on Ollama Cloud!

ollama(@ollama)6月1日153 字 (约 1 分钟)

The M3 model by MiniMax is now available on Ollama Cloud, deployed in the US with zero data retention, optimized for coding and agentic tasks. It achieves 59.0%+ on SWE-Bench Pro and supports up to 1M context length via sparse attention.

入选理由：M3 在 SWE-Bench Pro 基准中取得 59.0% 正确率，优于多数开源模型。

FeaturedTweet#M3#Ollama#MiniMax#Coding AI#Agentic AI英文

跨材料问答 · Sparse Attention

回答基于：Sparse Attention 相关 1 条材料