通过MRC(多路径可靠连接)解锁大规模AI训练网络
OpenAI联合AMD、NVIDIA等公司推出MRC协议,提升超大规模AI训练网络的性能与可靠性,并已开源至OCP,推动行业标准统一。
入选理由:MRC通过多路径传输和静态源路由设计,有效规避网络拥塞与单点故障,保障AI训练稳定性。
公司
别名:Advanced Micro Devices
美国半导体公司,提供高性能处理器和GPU。
已跟踪 16 条高相关材料
最近变化
2026-05-26 · 本地AI模型如Qwen 3.6和Gemma在实际工作中表现出色。
为什么值得关注
AMD 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
OpenAI 把训练 ChatGPT 用的网络协议开源了。https://t.co/s2euzfedsb 这套协议叫 MRC(Multipath Reliable Connection,多路径可靠连...
宝玉(@dotey) · 9.2 分
OpenAI 联合 AMD、英特尔、英伟达等公司开源 MRC 网络协议,通过多路径传输和源路由技术显著提升大模型训练集群的可靠性与效率,已在 Stargate 等超算中部署并验证效果。
Unlocking large scale AI training networks with MRC (Multipath Reliable Connection)
OpenAI Blog · 9.2 分
OpenAI联合多家科技巨头推出MRC(多路径可靠连接)协议,通过多平面网络、自适应分组喷洒和静态源路由等机制,显著提升超大规模AI训练集群的网络性能与容错能力,并已开源至OCP。
The Counterintuitive Networking Decisions Behind OpenAI’s 131,000-GPU Training Fabric
Towards Data Science · 9 分
OpenAI通过MRC协议构建了131,000 GPU训练网络,采用反直觉的网络设计,消除了传统三层控制平面,显著提升训练效率。
已收录 16 条与 AMD 相关的内容,按评分排序。
OpenAI联合AMD、NVIDIA等公司推出MRC协议,提升超大规模AI训练网络的性能与可靠性,并已开源至OCP,推动行业标准统一。
入选理由:MRC通过多路径传输和静态源路由设计,有效规避网络拥塞与单点故障,保障AI训练稳定性。
OpenAI 联合多家公司开源 MRC 协议,提升大模型训练网络可靠性,已在超算中部署验证。
入选理由:MRC 实现微秒级故障绕过,避免传统网络中断导致训练重启。
OpenAI通过MRC协议构建了131,000 GPU训练网络,采用反直觉的网络设计,显著提升训练效率。
入选理由:MRC协议消除传统三层控制平面,提升网络可靠性
小型专用模型如 CyberSecQwen-4B 在防御性网络安全任务中表现优于大型通用模型,且支持安全本地部署,无需 API 成本。
入选理由:CyberSecQwen-4B 在 CTI-MCQ 测试中以 0.5868 准确率超越 Cisco 8B 模型 8.7 个百分点。
Sam Witteveen探讨了在AMD硬件上运行本地AI的可能性,强调了本地AI在隐私和成本控制方面的优势。
入选理由:本地AI模型如Qwen 3.6和Gemma在实际工作中表现出色。
OncoAgent是一个开源的隐私保护肿瘤临床决策支持系统,结合了双层LLM架构和LangGraph拓扑,显著提升了决策支持系统的性能和安全性。
入选理由:OncoAgent结合了双层LLM架构和LangGraph拓扑
OpenAI联合AMD、NVIDIA等发布开源协议MRC,解决超大规模AI训练中多芯片数据同步的可靠性与效率瓶颈,显著减少GPU空转时间。
入选理由:MRC协议通过多路径传输提升大规模AI训练中数据同步的可靠性和带宽利用率。
AMD CEO苏姿丰在上海AI开发者大会上表示,AI竞争正从模型能力转向系统工程与全栈优化,开发者需要可落地、可优化、可持续演进的工程体系。AMD以ROCm开源平台为核心,提供云端到端侧的全栈算力,并持续加码中国开发者生态建设。
入选理由:AI行业竞争焦点正从模型能力转向系统工程与全栈优化能力,开发者需要可落地、可优化、可持续演进的工程体系
Andrew Ng 推出新课程《Transformers in Practice》,提供对基于 Transformer 的 LLM 工作机制的实践理解。
入选理由:课程由 Andrew Ng 和 Sharon Zhou 合作开发,与 AMD 合作推出
苹果暂停Vision Pro研发,团队分拆至Siri与visionOS;微信状态将上线访客记录;AMD或采用三星2nm制程。
入选理由:苹果Vision Pro项目被取消,原团队拆分至Siri与visionOS部门,重点转向AR眼镜和AI可穿戴设备。
AI 既推动芯片创新,也因智能体应用加剧算力消耗,形成算力悖论。
入选理由:AMD CTO Mark Papermaster 在 HumanX 演讲中提出,异构计算是其 AI 芯片战略核心。
大型语言模型存在推理速度慢、幻觉问题和成本不随规模降低的问题,课程《Transformers in Practice》帮助解决这些问题。
入选理由:大型语言模型的推理速度慢,影响实际应用。
AMD Ryzen AI Halo的本地硬件方案为AI开发者提供了更自主的开发环境,作者认为本地开发比云端更具吸引力,并提议探索自研硬件。
入选理由:Ryzen AI Halo支持本地硬件开发,减少对云端的依赖
Greg Brockman 宣布 OpenAI 联合 AMD、NVIDIA 等公司推出开源网络协议 MRC,声称可提升大规模 AI 训练集群的可靠性与效率,但全文仅一条推文,无技术细节、架构图或实测数据,信息密度极低。
入选理由:OpenAI 联合多家硬件厂商发布开源网络协议 MRC,用于优化 AI 训练集群通信。
Anush Elangovan from AMD在AI Dev 26上分享了工程从编写代码转向引导意图的趋势,强调了代理型AI的重要性。
入选理由:工程正在从编写代码转向引导意图。
爱范儿早报汇总了Google I/O大会发布的AI更新(Gemini Omni/3.5模型、音频智能眼镜)、苹果iOS 27快捷指令改版、DeepSeek异常回复说明、AMD智能体主机概念、小米YU7 GT纽北刷纪录、华为领跑中国手机市场等10余条科技新闻,整体为新闻聚合性质,缺乏深度分析。
入选理由:Google发布Gemini Omni多模态模型和Gemini 3.5 Flash,输出token速度比其他前沿模型快4倍,同步推出个人AI智能体Gemini Spark和音频智能眼镜