Why MCP and ChatGPT Apps Use Double Iframes — Frédéric Barthelet, Alpic
ChatGPT 和 MCP 应用使用双 iframe 机制实现交互式 UI,提升用户体验和功能扩展性。
- 双 iframe 机制允许在 ChatGPT 和 MCP 应用中嵌入交互式 UI。
- MCP 应用通过 views 实现动态 UI 渲染,基于工具调用结果。
- OpenAI 在去年 10 月发布了支持 MCP 应用的 SDK。
今天先读这些高质量内容。
AI 工程化正从单纯的模型能力竞赛,转向以“外部验证”和“成本约束”为核心的生产力落地阶段。
在基础研究与智能体架构层面,**Test-time Compute**(推理时计算)正在重塑模型解决复杂问题的范式。Google 的 **LEAP 框架**与 OpenAI 的最新突破均证明,通过引入 Lean 编译器或数学验证器作为外部反馈闭环,通用大模型能在 IMO 级难题上实现从个位数到 70% 求解率的跃升,这比单纯扩大参数规模更为有效。与此同时,NVIDIA 发布的 **Nemotron 3 Ultra** 则试图在基础设施侧回应长时运行 Agent 的需求,其 550B 参数配合 LatentMoE 架构,旨在同等推理成本下将专家密度提升 4 倍,并以开放许可支持企业本地部署,显示出行业对“高智商且可负担”的专用 Agent 基座的迫切需求。
然而,当技术进入真实业务场景,评估标准与成本控制成为新的博弈焦点。**SWE-rebench** 的研究揭示,编码 Agent 在生产环境的稳定性远比基准测试分数重要,必须通过月度“新鲜问题”来规避数据污染并考察工具调用能力;LangChain 在药物研发中的实践也印证了这一点,即以 SQL 为核心的结构化代理能将临床周期缩短一半,打破了“大模型无法做新事”的质疑。但另一方面,Uber 对 Claude Code 等工具实施每月 $1,500 的硬性配额,表明即便 AI 能带来显著提效,企业仍将其视为需严格核算 ROI 的成本项而非无限资源,这与 Vercel 宣称的“1000 倍价值跃升”形成了现实张力。
今天的关键判断是:AI 应用的护城河不再仅由模型智力决定,而是取决于能否构建可靠的外部验证机制以及在明确成本边界内交付可量化的业务结果。
ChatGPT 和 MCP 应用使用双 iframe 机制实现交互式 UI,提升用户体验和功能扩展性。
Z AI 发布 GLM-5.2,支持 1M token 上下文窗口,性能超越 GPT-5.5 和 Opus 4.8。
GLM 5.2 在 SWE 领域表现强劲,排名第三,仅次于 Fable 5 和 Opus 4.8,且优于 GPT-5.5。
GLM-5.2 是一个具有显著编码和智能代理任务能力的开源模型,支持 1M 上下文窗口和两种推理模式。
通过优化技术,云浏览器成本降低至原来的三分之一,同时启动和扩展速度显著提升。
SpaceX 的迭代循环强调质疑需求、删除冗余、简化优化、加速周期和自动化,为工程组织提供了高效实践的范例。
Cursor 旨在通过新型编程方式降低开发门槛,让开发者用更简洁的表达描述意图,由模型完成具体实现。
智谱 GLM-5.2 开源,支持百万上下文和思考力度控制,计算效率提升 2.9 倍。