T
traeai
登录

公司

什么是 Together AI

也叫:togetherai

云服务提供商,专注于为大型语言模型提供高效的推理平台。

为什么现在值得关注?

最近变化

2026-06-02 · MiniMax M3 supports 1M-token context and native multimodality, making it suitable for complex real-world tasks.

Together AI 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。

📰 Together AI 最新动态

已收录 9 篇与「Together AI」相关的 AI 资讯和分析。

Serving MiniMax-M3 for efficient inference: Unlocking 1M-Token Context and Multimodality Without Regrets

高效推理MiniMax-M3:解锁1M令牌上下文和多模态能力

Together AI Blog1686 字 (约 7 分钟)
87

Together AI优化了MiniMax M3模型的部署,通过架构和工程创新实现81–125%吞吐量提升。

入选理由:MiniMax M3 supports 1M-token context and native multimodality, making it suitable for complex real-world tasks.

精选文章#MiniMax#M3#稀疏注意力#多模态#推理优化英文
Engineering voice agents: Latency, quality, and scale — Rishabh Bhargava, Together AI

构建高质量、低延迟、可扩展的语音代理已成为工程核心挑战,需解决实时响应(<500ms)、复杂指令处理与工具调用等关键问题,Together AI 提供基础设施支持。

入选理由:语音代理必须在500毫秒内响应,否则用户会挂断电话,实时性是核心指标。

精选视频#语音AI#延迟优化#Together AI#代理工程英文
How Together AI built the world’s fastest speech-to-text stack

Together AI 如何构建全球最快的语音转文字堆栈

Together AI Blog1720 字 (约 7 分钟)
85

Together AI 通过使用基于 profiles 的 TensorRT 优化其语音转文字堆栈,通过优化解码器循环和改进 CPU 路径,实现了更快的转录速度。他们提供的两个最低延迟模型中,最快的模型可以在不到 10 秒内转录 20 小时的语音。

入选理由:Together AI built the world's fastest speech-to-text stack.

精选文章#Together AI#语音转文字英文
Benchmarking inference at scale: coding agents

大规模推理基准测试:编码代理

Together AI Blog1358 字 (约 6 分钟)
85

Together推理引擎在编码代理工作负载中比其他开源引擎多提供31%的TPS,并在饱和状态下保持2倍的TTFT优势。性能提升来自全栈优化。

入选理由:ThunderMLA、自定义内核重写和端到端优化使Together引擎比其他OSS引擎多31%的TPS

精选文章#Together AI#推理引擎#编码代理#性能优化#TTFT英文
Together AI and Pearl Research Labs Team Up to Reduce the Cost of AI Inference

Together AI 与 Pearl Research Labs 合作降低 AI 推理成本

Together AI Blog979 字 (约 4 分钟)
85

Together AI 与 Pearl Research Labs 合作,通过 FlashAttention-4、ATLAS 等技术降低 AI 推理成本。

入选理由:FlashAttention-4 提升推理速度达 1.3 倍。

精选文章#AI#推理优化英文
Violin: An open-source video translation skill that breaks language barriers

Violin:打破语言障碍的开源视频翻译技能

Together AI Blog1617 字 (约 7 分钟)
75

Violin 是 Together AI 推出的开源视频翻译工具,通过多模态模型实现高质量视频内容本地化。

入选理由:Violin 支持多语言视频翻译,提升跨语言内容可访问性。

精选文章#AI#视频处理#自然语言处理英文
DeepSeek-V4 Pro now available on Together AI

DeepSeek-V4 Pro 现在可在 Together AI 上使用

Together AI Blog1895 字 (约 8 分钟)
75

Together AI 推出 DeepSeek-V4 Pro 模型,提供高性能推理和多种计算选项。

入选理由:DeepSeek-V4 Pro 在 NVIDIA Blackwell 上实现 1.3 倍速度提升。

精选文章#AI#模型部署#深度学习中文
Foundational research powering efficient inference at scale

Foundational research powering efficient inference at scale

Together AI Blog2272 字 (约 10 分钟)
75

文章介绍了Together AI的多项技术进展,包括FlashAttention-4、ATLAS加速器和Batch Inference API更新,显著提升了大规模推理效率。

入选理由:FlashAttention-4比cuDNN快1.3倍

精选文章#AI#Inference#Efficiency#Together AI英文

与「Together AI」经常一起出现的 AI 术语。

💡 想追踪「Together AI」的长期趋势?去 实体雷达 · Together AI 查看详细分析和跨材料问答。

AI 可能会生成不准确的信息,请核实重要内容