Advancing voice intelligence with new models in the API
OpenAI introduces three real-time audio models to enhance voice applications.
入选理由:GPT-Realtime-2 能处理复杂请求并自然延续对话。
模型
OpenAI 推出的实时语音翻译模型。
已跟踪 8 条高相关材料
最近变化
2026-05-29 · GPT-Realtime-Translate 是 OpenAI 的新模型,可将语音输入实时翻译为指定目标语言。
为什么值得关注
GPT-Realtime-Translate 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
Advancing voice intelligence with new models in the API
OpenAI Blog · 9.2 分
OpenAI 推出三款实时语音模型,提升语音应用的智能化水平。
OpenAI 在 Realtime API 里上线了三款新语音模型:GPT-Realtime-2、GPT-Realtime-Translate 和 GPT-Realtime-Whisper,分别管对话...
宝玉(@dotey) · 8.9 分
OpenAI发布了三款新语音模型:GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper,显著提升了对话、翻译和实时转录能力。
Interaction Models
Hacker News Best · 8.7 分
交互模型(Interaction Models)通过原生支持多模态实时交互,突破传统单线程对话的瓶颈,使AI能像人类协作一样持续感知、响应和行动,显著提升人机协同效率。该技术在智能与响应性上达到行业领先水平。
已收录 8 条与 GPT-Realtime-Translate 相关的内容,按评分排序。
OpenAI introduces three real-time audio models to enhance voice applications.
入选理由:GPT-Realtime-2 能处理复杂请求并自然延续对话。
OpenAI released three new voice models: GPT-Realtime-2, GPT-Realtime-Translate, and GPT-Realtime-Whisper, significantly enhancing dialogue, translation, and real-time transcription capabilities.
入选理由:GPT-Realtime-2在Big Bench Audio智能测试上从81.4%提升到96.6%,支持更复杂的任务编排。
Interaction models enable native real-time multimodal interaction, overcoming the limitations of traditional turn-based interfaces and significantly enhancing human-AI collaboration efficiency.
入选理由:采用多流微轮次设计,实现跨音频、视频、文本的实时交互响应。
OpenAI has introduced two new real-time audio models: GPT Realtime Translate supports live translation across 70 languages, while GPT Realtime 2 enhances voice assistant capabilities with intelligent reasoning.
入选理由:GPT Realtime Translate能够实现实时跨70种语言的翻译。
OpenAI 推出实时翻译模型 GPT-Realtime-Translate,支持 70+ 输入语言和 13 种输出语言,专为智能眼镜等设备优化。
入选理由:GPT-Realtime-Translate 是 OpenAI 的新模型,可将语音输入实时翻译为指定目标语言。
OpenAI has released three new voice models: GPT-Realtime-2, GPT-Realtime-Translate, and GPT-Realtime-Whisper, supporting real-time translation across more than 70 input and 13 output languages.
入选理由:GPT-Realtime-2能够构建生产就绪的语音代理,处理复杂对话并保持流畅。
GPT-Realtime-Translate enables real-time speech translation, supporting over 70 input languages and 13 output languages.
入选理由:GPT-Realtime-Translate 支持 70 多种输入语言和 13 种输出语言。
OpenAI has released GPT-Realtime-2, GPT-Realtime-Translate, and GPT-Realtime-Whisper, now available in the Realtime API.
入选理由:GPT-Realtime-2提升了实时处理能力。