GPT 最近有什么新动态？

traeai 已收录 30 篇与 GPT 相关的内容。最新一篇是「How to build agents when the smartest AI isn't smart enough」，由 LangChain 发布。

模型

GPT

Q: 什么是 GPT？

OpenAI开发的生成式预训练模型

别名：ChatGPT

OpenAI开发的生成式预训练模型

已跟踪 30 条高相关材料

TraeAI 观察

如果只读 3 篇

How to build agents when the smartest AI isn't smart enough

LangChain · 8.7 分

通过在Benchling平台之上构建面向科研的智能代理，将从实验发现到药物临床的周期提速2倍；代理以SQL为中心，结合嵌入与生产轨迹评估，挑战“大模型无法做新事”的认知。

Nemotron 3 Ultra NVIDIA's 550B Open Model

Sam Witteveen · 8.7 分

Nvidia 推出 550B 参数 Neotron 3 Ultra，采用混合专家架构与 55B 活跃参数，专为代理任务训练，实测在代理基准上超越多款万亿参数模型，并公开数据与配方，利于企业本地化与定制微调。

Huge launch from @tryramp. Different steps in an agent workflow can use different models. This can ...

elvis(@omarsar0) · 8.5 分

Ramp Router通过动态模型路由显著降低AI成本，成为LLM堆栈核心组件。

如何在最智能的AI不够时构建代理

LangChain6月4日13537 字 (约 55 分钟)

在Benchling平台构建的科研代理可将从实验发现到药物临床的周期缩短至约一半；代理以SQL为核心并结合嵌入与生产轨迹评估，证明大模型在科研中可完成新颖任务。

入选理由：在Benchling平台构建的科研代理可将从实验发现到药物临床的时间缩短至约一半（提速2x）。

精选视频#Benchling#Benchling AI#科研代理#SQL#大模型英文

Nemotron 3 Ultra NVIDIA's 550B Open Model

Nemotron 3 Ultra：NVIDIA 的 5500 亿参数代理开源模型

Sam Witteveen6月4日3906 字 (约 16 分钟)

NVIDIA 推出 5500 亿参数的 Neotron 3 Ultra，采用混合专家架构并专为代理任务训练，在代理基准上超越多款万亿参数模型，且公开数据与配方，便于企业本地部署与定制微调。

入选理由：Neotron 3 Ultra 为 550B 参数混合专家模型，活跃参数约 55B，专为代理任务训练。

精选视频#Nemotron3Ultra#5500B#混合专家#代理基准#开源模型英文

Huge launch from @tryramp. Different steps in an agent workflow can use different models. This can ...

elvis(@omarsar0)7月21日161 字 (约 1 分钟)

Ramp Router通过动态模型路由显著降低AI成本，成为LLM堆栈核心组件。

入选理由：模型路由可降低30%以上推理成本

精选推文#模型路由#LLM#成本优化#OpenAI英文

Honestly the most important line here: "It wasn't a better model. It was CONTEXT." Everyone is deba...

Aadit Sheth(@aaditsh)6月24日234 字 (约 1 分钟)

上下文的重要性超过模型本身，AI对工作内容的理解比模型的智能更重要。

入选理由：上下文比模型的智能更重要，AI对工作内容的理解决定效果。

精选推文#AI#上下文#模型#生产力中英混合

全球首个人形机器人通用小脑来了！全球最大规模2万小时人类动作数据，实现零样本泛化

量子位6月19日4099 字 (约 17 分钟)

银河通用机器人发布AstraBrain-WBC 0.5，基于2万小时人类动作数据训练，实现零样本泛化，推动人形机器人进入‘GPT时代’。

入选理由：AstraBrain-WBC 0.5基于20亿帧人类动作数据训练，数据规模比肩GPT-1。

精选文章#人形机器人#AI#运动控制#Transformer#银河通用中文

[AINews] GLM > GPT? GLM-5.2 passes vibe check; Z.ai forecasts Open Fable by December

Latent Space6月19日2215 字 (约 9 分钟)

GLM-5.2在多个基准测试中表现优异，被认为是首个接近前沿水平的开源模型，Z.ai预计将在年底前推出Open Fable模型。

入选理由：GLM-5.2通过多项基准测试，被认为是首个接近前沿水平的开源模型。

精选文章#GLM#开源模型#AI#Z.ai#GPT英文

OpenAI CFO Sarah Friar on IPO, AI Rivalries, New Device, and Spending $100B+ on Compute

OpenAI CFO Sarah Friar谈IPO、AI竞争、新设备及超1000亿美元算力投入

All-In Podcast6月2日8085 字 (约 33 分钟)

OpenAI CFO Sarah Friar透露公司已完成超过1200亿美元的融资，是历史上最大规模的私募融资，强调IPO并非目标而是融资手段，同时指出AI时代将带来全球生产力变革。

入选理由：OpenAI在2023年3月完成1220亿美元融资，为史上最大私募融资，远超此前任何一轮。

精选视频#OpenAI#IPO#AI#融资#Anthropic英文

Building Frontier CX Agents | Interrupt 26

构建前沿CX代理 | 中断26

LangChain6月3日5425 字 (约 22 分钟)

思科的CX部门通过标准化流程和AI应用处理客户体验，2026年或成企业关注业务工作流之年。

入选理由：Cisco CX部门有约2万人，负责从落地到续订的全流程。

精选视频#思科#客户体验#业务工作流英文

Anyone can build and share apps in Codex

任何人都可以在 Codex 中构建和分享应用

OpenAI6月2日882 字 (约 4 分钟)

OpenAI 推出 Codex 平台，允许任何人通过自然语言构建和分享应用程序，无需编程经验，显著降低 AI 应用开发门槛。

入选理由：Codex 支持用户使用自然语言指令生成完整应用，如聊天机器人、数据分析工具等。

精选视频#OpenAI#Codex#AI开发#低代码#自然语言编程英文

If “Insanity is doing the same thing over and over again and expecting different results”, what the ...

如果‘疯狂是反复做同一件事却期待不同结果’，那生成式AI到底是什么？

Gary Marcus(@GaryMarcus)6月2日97 字 (约 1 分钟)

生成式AI本质上是重复使用相同训练数据和模型架构进行预测，却期望获得不同结果，这与‘疯狂’的定义高度相似，揭示了当前AI方法论的根本局限性。

入选理由：生成式AI依赖于大规模预训练模型（如GPT）反复生成内容，但未改变底层机制。

精选推文#生成式AI#AI批评#Gary Marcus#模型局限性#人工智能哲学英文

How to Use AI Agents to Automate Your Entire Workflow in 2026

AI Master5月19日1981 字 (约 8 分钟)

Pocky推出的沙盒化AI代理Pocky Claw通过并行执行架构和加密凭证库，实现了70%的token成本降低、零本地设置和企业级安全性，成功自动化了复杂工作流开发。

入选理由：Pocky Claw采用并行执行架构，多子代理同时工作，将原本需要3-4小时的开发任务压缩至90秒内完成

精选视频#AI代理#工作流自动化#企业安全#Pocky#Token优化英文

9 AI Agent Skills To Get Ahead of 99% of People

Riley Brown6月19日8085 字 (约 33 分钟)

AI代理技能将决定未来职场竞争力，掌握自然语言交互和高效工具使用是关键。

入选理由：AI模型正从依赖提示工程转向自然语言交互。

精选视频#AI代理#自然语言交互#职场技能#AI工具英文

The Production AI Playbook: Deploying Agents at Enterprise Scale — Sandipan Bhaumik, Databricks

AI Engineer6月19日8790 字 (约 36 分钟)

企业级AI代理部署需关注模型选择、数据治理与规模化架构，而非仅聚焦于技术演示。

入选理由：选择模型时应优先考虑企业数据兼容性，而非单纯追求最新技术。

精选视频#AI#企业部署#Databricks#模型选择英文

One model hallucinates during silence. So Sierra runs two. #Shorts

LangChain6月25日165 字 (约 1 分钟)

为解决语音转录模型在静音时产生幻觉的问题，Sierra 采用并行运行两个模型的策略，提高转录准确性。

入选理由：使用两个模型并行处理静音段，可减少幻觉问题。

精选视频#语音转录#模型优化#AI技术英文

提示词如下，建议Youmind中使用，也可以用GPT单张生成提示词再生成。你是一位专业的 PPT 设计师，同时也是内容提炼与视觉叙事专家。用户提供原始内容（文章、笔记、链接、产品介绍、演讲主题等...

向阳乔木(@vista8)5月25日976 字 (约 4 分钟)

文章提供了详细的PPT设计指导原则和步骤，包括内容理解、结构设计、视觉决策和图像提示词生成的具体规则。

入选理由：遵循优雅、极简、现代的设计风格

精选推文#PPT设计#视觉叙事#内容提炼中文

很多人创业时最容易犯的错，就是把“最热”当成“最好”

AI Will(@FinanceYF5)5月18日166 字 (约 1 分钟)

创业时易将热门趋势误认为最佳选择，真正成功公司往往在情绪之外建立长期价值。

入选理由：创业时应避免将‘最热’视为‘最好’，需关注实际价值。

精选推文#创业#趋势#商业#技术中文

Not everyone will succeed in the model business. "You've seen a lot of companies spend a huge amoun...

cohere(@cohere)7月11日89 字 (约 1 分钟)

模型业务成功不仅依赖计算资源投入，更需关注模型质量与工程能力。

入选理由：70%的AI公司因模型质量不佳导致失败（行业调研数据）

精选推文#AI模型#算力优化#工程实践#机器学习中英混合

2002: I'll google it 2015: I'll uber over 2026: I'll GPT it (???). I'll claude it (???) Why haven't...

andrew chen(@andrewchen)6月27日93 字 (约 1 分钟)

文章探讨了AI技术在不同年份的使用方式，但缺乏深度分析和具体技术内容。

入选理由：文章未提供具体技术机制或架构分析。

精选推文#AI#技术趋势英文

Do we need a new social app?

Lenny's Podcast6月23日228 字 (约 1 分钟)

文章认为当前社交应用缺乏创新，未来需要重新设计适应AI时代的社交体验。

入选理由：当前主流社交应用如Snapchat、Instagram和TikTok已失去吸引力。

精选视频#社交应用#AI#用户体验英文

微软双向转售GPT与DeepSeek成全球最大AI中间商

AI HOT 精选6月20日329 字 (约 2 分钟)

微软通过双向转售GPT和DeepSeek模型，成为全球最大AI中间商，推动中美AI模型贸易网络形成。

入选理由：微软将ChatGPT卖给中国企业，同时将DeepSeek模型卖给西方客户。

精选文章#微软#AI#DeepSeek#GPT#商业中英混合

相比 GLM 5.2 生成的前端网页效果，GPT目前版本就是垃圾。即使用目前很好的 Skill，依然救不回来Codex中GPT的拉胯效果。

向阳乔木(@vista8)7月6日152 字 (约 1 分钟)

GPT当前版本在前端网页生成效果上显著落后于GLM 5.2，实用性存疑。

入选理由：GPT生成的前端效果被指不如GLM 5.2

精选推文#GPT#GLM#前端#AI生成中文

同事说现在 Codex 给的太多太多了，实在用不完
于是在 Cola 里加了个 Codex 登录功能
这样用户就可以直接用 Codex 套餐驱动 Cola 了
双厨狂喜
此外，Cola 现在也支持用户...

Cola新增Codex登录功能，支持自定义API Key

orange.ai(@oran_ge)5月20日177 字 (约 1 分钟)

Orange AI产品Cola新增Codex登录功能，用户可使用Codex套餐驱动Cola，同时Cola现已支持用户填写自己的API key，目前支持GPT和Claude模型。

入选理由：Cola新增Codex登录功能，用户可直接使用Codex套餐驱动Cola应用

精选推文#Cola#Codex#Orange AI#API集成#产品更新中文

语言的污染是很可怕的很多人说话和写文已经越来越GPT味儿了... 平时没事儿还是多换几个模型换着用

orange.ai(@oran_ge)7月15日158 字 (约 1 分钟)

文章警告过度依赖GPT可能导致语言同质化，建议工程师多使用不同模型保持多样性。

入选理由：过度使用GPT会导致语言风格趋同（推文原文）

精选推文#AI#语言模型#技术趋势中文

GPT 5.6 luna 都超过了 Opus 4.8 这个模型太离谱了价格还特别便宜… 接下来新模型无法超越 luna 的话，发出来就没意义了…

orange.ai(@oran_ge)7月13日50 字 (约 1 分钟)

文章链接无法访问，内容缺失，无法提供有效技术信息。

入选理由：文章内容无法访问，无法评估技术价值

精选推文#GPT#模型比较#AI其他

Cursor 收购了 Continue @continuedev Cursor 这几天近乎刷屏，被 SpaceX 600 亿美金收购、宣布 Agent 版 Github「Origin」、几周后发布...

meng shao(@shao__meng)6月18日139 字 (约 1 分钟)

Cursor 收购 Continue，但文章信息密度低，缺乏技术深度和具体细节。

入选理由：Cursor 收购了 Continue

精选推文#Cursor#Continue#AI#收购中英混合

Arena 测评，对于设计方面，Claude 是断崖式领先的，假如不用 Claude，可以试试看 Qwen 3.7 Max，我最近用了几下，真的挺惊艳的，GPT 一直都拉，丑的不行。不过仅靠提示词...

Viking(@vikingmute)6月16日347 字 (约 2 分钟)

文章对 Claude 和 Qwen 3.7 Max 的设计能力进行对比，指出 Claude 表现更优，但提示词重复使用易导致审美疲劳。

入选理由：Claude 在设计方面表现优于 Qwen 3.7 Max 和 GPT。

精选推文#Claude#Qwen#AI设计#提示词中文

AI记忆能力有多好？

DeepLearning.AI6月2日101 字 (约 1 分钟)

AI模型当前可处理高达750,000词的上下文，相当于4-5本《哈利·波特》书，远超人类6-7项的短期记忆容量。

入选理由：领先AI模型支持750,000词上下文，覆盖4-5本《哈利·波特》书内容。

精选视频#AI#上下文长度#记忆#模型英文

Suhail on X: Dario对机械可解释性感兴趣

Suhail(@Suhail)5月18日98 字 (约 1 分钟)

文章指出Dario对机械可解释性感兴趣，因观看完整源代码视频，强调‘I don’t know’的坦诚。

入选理由：Dario对机械可解释性感兴趣，因观看完整源代码视频

精选推文#AI#可解释性#模型透明度中文

What I am about to describe ain’t AGI; it’s a sign of a trillion dollar trainwreck.

If I had told y...

Gary Marcus on X: 'What I am about to describe ain’t AGI; it’s a sign of a trillion dollar trainwreck.'

Gary Marcus(@GaryMarcus)5月18日175 字 (约 1 分钟)

Gary Marcus警告：当前AI发展是万亿级灾难的前兆，而非AGI。

入选理由：AI发展将导致万亿级灾难，而非AGI

精选推文#AI#技术#风险#公司中文

这个更明显点，左边 GPT 右边 NanoBanana 2

歸藏(guizang.ai)(@op7418)6月20日58 字 (约 1 分钟)

文章仅展示两张图片对比 GPT 与 NanoBanana 2，缺乏技术深度与实用信息。

入选理由：文章未提供技术细节或实用价值。

精选推文#AI#对比中文

跨材料问答 · GPT

回答基于：GPT 相关 30 条材料