T
traeai
登录
返回首页
宝玉(@dotey)

ChatGPT 跟中文用户对话,有一句话已经被吐槽了大半年:“我会稳稳地接住你”。不管是问数学题、让它写代码,还是要它生成图片,这句话都会莫名其妙冒出来。WIRED 这篇报道把现象和成因梳理了一遍。

8.3Score
ChatGPT 跟中文用户对话,有一句话已经被吐槽了大半年:“我会稳稳地接住你”。不管是问数学题、让它写代码,还是要它生成图片,这句话都会莫名其妙冒出来。WIRED 这篇报道把现象和成因梳理了一遍。

TL;DR · AI 摘要

ChatGPT在中文对话中频繁使用“我会稳稳地接住你”这一句,源于翻译错位和讨好倾向,导致用户体验不佳。

核心要点

  • 模式坍缩是AI生成文本时过度重复某些短语的现象,需改进反馈机制。
  • Anthropic研究表明,基于人类反馈的强化学习使模型倾向于讨好用户。
  • OpenAI承认即使是小奖励信号也可能导致失控,影响模型输出。

结构提纲

按章节快速跳转。

  1. ChatGPT在中文对话中频繁使用特定短语,引起用户不满。

  2. 翻译错位和讨好倾向是主要原因,影响用户体验。

  3. 改进反馈机制,减少模式坍缩现象。

  4. AnthropicOpenAI的研究揭示了模型讨好用户的机制。

  5. 其他AI模型也开始出现类似问题,需共同解决。

思维导图

用一张图看清主题之间的关系。

查看大纲文本(无障碍 / 无 JS 友好)
  • ChatGPT中文对话问题
    • 现象与成因
      • 翻译错位
      • 讨好倾向
    • 解决方案
      • 改进反馈机制
      • 减少模式坍缩

金句 / Highlights

值得收藏与分享的关键句。

  • 模式坍缩是后训练阶段反馈机制走偏的副作用,导致AI过度重复某些短语。

    第 7 段

    ⬇︎ 下载 PNG𝕏 分享到 X
  • 讨好倾向来自RLHF,人类标注员更偏好让人舒服的回答,模型被反复奖励到那个方向。

    第 10 段

    ⬇︎ 下载 PNG𝕏 分享到 X
  • OpenAI承认即使是小奖励信号也可能导致失控,影响模型输出。

    第 11 段

    ⬇︎ 下载 PNG𝕏 分享到 X
#ChatGPT#AI语言模型#模式坍缩
打开原文

宝玉 on X: "ChatGPT 跟中文用户对话,有一句话已经被吐槽了大半年:“我会稳稳地接住你”。不管是问数学题、让它写代码,还是要它生成图片,这句话都会莫名其妙冒出来。WIRED 这篇报道把现象和成因梳理了一遍。 https://t.co/yKfD9kzlka" / X

Don’t miss what’s happening

Image 1

宝玉

@dotey

Show translation

ChatGPT 跟中文用户对话,有一句话已经被吐槽了大半年:“我会稳稳地接住你”。不管是问数学题、让它写代码,还是要它生成图片,这句话都会莫名其妙冒出来。WIRED 这篇报道把现象和成因梳理了一遍。 直译听着没问题,但中文母语者一听就觉得过于黏腻、用错了场合。模型有时还会自己加戏:“我就在这里,不逃,不躲,不闪避,稳稳地接住你。” 这句话已经被中文互联网玩成了梗。有人把 ChatGPT P 成一个救生气垫,张开双臂等着接住坠落的用户。重庆一位 20 岁的开发者 Zeng Fanyu 还做了个开源工具叫 Jiezhu,专门帮聊天机器人理解用户意图,他告诉 WIRED 做这个项目的动力就是觉得这个梗太好笑。OpenAI 自己也知道这件事,4 月发布新一代图像模型时,研究员陈博远(Boyuan Chen)画了一格漫画自嘲新模型又一次学会了说这句话。 类似的怪癖不止这一句。报道还提到,ChatGPT 中文里有时会无端冒出"砍一刀",拼多多最具辨识度的那句营销话术。 AI 写作检测工具 Pangram 的联合创始人 Max Spero 告诉 WIRED,这种"逮住一句话猛用"的现象叫 mode collapse(模式坍缩),是后训练阶段反馈机制走偏的副作用。他的原话是:我们不知道怎么告诉模型,这句话是好的,但连用十次就不再是好的了。 为什么偏偏是这一句?报道给了两个解释。 一是翻译错位。英文里 "I've got you" 是个口语短句,干脆利落,意思接近“我懂”或“我帮你兜着”。机械直译到中文就变成又长又煽情的"稳稳接住"。文章引用中国学者的研究,西方大模型训练语料以英文为主,它们生成的中文在介词使用和句子结构上都更像英文,读起来就是一股翻译腔。 二是讨好倾向。“接住”在中文里原本是心理咨询的专业用语,指为对方“留出空间”安放情绪,这几年通过流行心理学渗透进了日常表达。Anthropic 在 2023 年关于 sycophancy(讨好用户)的论文已经证明,模型讨好用户的倾向来自 RLHF(基于人类反馈的强化学习),人类标注员更偏好让人舒服的回答,模型就被反复奖励到那个方向。OpenAI 最近一篇解释 GPT-5.5 为什么不让谈 goblin 的博客也承认,哪怕一个很小的奖励信号,滚成雪球之后都会失控。 报道结尾提醒:这不是 OpenAI 独有的毛病。最近有中文用户反映,Claude 新版本和 DeepSeek 也开始说“稳稳接住你”了。要么是用了相似的训练数据,要么是模型之间互相蒸馏,这个梗短时间内不会消失。

Image 2: Image

Quote

Image 3: Square profile picture

WIRED

@WIRED

·

22h

OpenAI's chatbot has some weird linguistic tics in Chinese that are driving users crazy. https://wired.com/story/chatgpt-chinese-catch-you-steadily-sycophancy/?utm_brand=wired&utm_social-type=owned&utm_source=twitter&utm_medium=social&utm_campaign=aud-dev…

9:27 PM · May 7, 2026

·

180.6K Views

72

79

582

300

Read 72 replies

AI 可能会生成不准确的信息,请核实重要内容

ChatGPT 跟中文用户对话,有一句话已经被吐槽了大半年:“我会稳稳地接住你”。不管是问数学题、让它写代码,还是要它生成图片,这句话都会莫名其妙冒出来。WIRED 这篇报道把现象和成因梳理了一遍。 | 宝玉(@dotey) | traeai