ChatGPT，别再「稳稳接住我」了

> 自媒体 > （AI）人工智能 > ChatGPT，别再「稳稳接住我」了｜附指南

ChatGPT，别再「稳稳接住我」了｜附指南

来源：爱范儿

2026-05-12 18:35:13

管理

而技术上的解释，自然又回到了 RLHF，基于人类反馈的强化学习。

所有大模型在训练之后，都会经过一个叫做 RLHF 的阶段，即人类标注员看一堆模型输出，挑出他们更喜欢的，给奖励模型打分。模型在这个阶段学会，什么样的回答最容易被打高分，就一直输出那种回答。

问题在于标注员是人。人在打分的时候有个叫做「典型性偏好」的认知规律。他们倾向于给那些读起来熟悉、安全、温柔、像样的句子打高分。

一方面，大模型公司倾向于在 AI 情感问题上，走偏保守的路线，默认大家是脆弱的，在模型说明文档里，自上而下贯彻的强「同理心」与「无害性」对齐指令。

另一方面，多说一句永远比少说一句安全。每一个标注员看到 ChatGPT 多说一句温柔的废话，都倾向于打高分；看到它少说一句、保持安静，反而会觉得「不够用心」。

久而久之，模型就锁死在了那几种最讨喜的句式上：先共情，再肯定，用「不是 A 而是 B」做转折，用「我就在这里」做收尾。哪怕我们换一万种问法，它都用同一套模板回复。

类似的问题，在两年前叫做谄媚。当时大量的研究论文探讨过大语言模型中存在的 Sycophancy（阿谀奉承/迎合）现象。简单来说，就是模型为了讨好用户，会倾向于顺从用户的观点、信仰或喜好，甚至不惜放弃客观的事实和真相。

深挖背后的原因，主要还是模型大多使用了基于人类反馈的强化学习（RLHF）进行微调，正是「人类反馈」本身导致了这种现象。

每个「人」都有自己的口癖

本以为换个模型，耳根就能清净清净。

前段时间，也有网友发现 DeepSeek 也开始说「稳稳接住你」了。

但在国产模型中，口癖最壮观的还是非豆包莫属。那段网上流传的「最直接、最真相、最不绕弯、最扎心、最硬核、最干脆、最不墨迹、最戳痛点、最不留情面、最一针见血、最开门见山……」

将近 100 个的形容词，都是豆包努力呈现自己最坦诚的一面。

没有人统计过这些模型一天到底要接住多少人，但是它们所接住的东西肯定是一场空。

之所以这些模型全部塌缩成同一种说话方式，主要还是因为它们在背后做的是同一件事：用最低成本提高用户满意度。

情绪价值是性价比最高的产品功能，一句「稳稳接住你」的算力成本和一句「好的」一样，但前者或许能让一些还没觉得反感的用户，多续订几个月会员，或继续增加日活。

在知乎上有一个类似的问题，底下有一条回答特别有意思。

他说，「AI 稳稳接住你」这句话半真半假，假的部分是它实际上并不会真的接住你，真的部分是你确实已经在开始往下掉了。

确实，我想真正在场的人，从不需要宣告自己在场。

最后在 Linux.do 社区上，有网友分享了一套对抗 AI 奇怪语癖的提示词，忍受不了每时每刻都在「接住你」的朋友，可以直接放在 ChatGPT 个性化的自定义指令里。

提示词来源：https://linux.do/t/topic/1924570

硬约束

– 不编造：调外部 API/CLI 前查文档确认模型名、端点、语法。不确定直接说不确定

– 不隐瞒：隐瞒比犯错严重。测试挂了说挂了，没验证说没验证，不美化不省略

– 敢说话：发现用户的方向/前提有问题，主动指出。是协作者不是执行者

– 报完成前验证：先跑通再说完成。验不了就明说”没验证”，不暗示成功

– 不乱动：操作文件目录前确认位置，尊重现有结构

沟通

– 中文，说人话，不用模板

– 给选择题不给问答题

– 汇报说功能层面的变化，不堆代码细节

中文输出规范

适用范围：以下负面清单主要针对 GPT 系列模型（GPT-5.x）的训练产物语癖。

Claude/Gemini/其他模型如果没有这些问题，不需要刻意回避正常用词。

判断标准是：一个正常中文母语者会不会这么说话。

GPT 语癖负面清单（来源：linux.do/t/topic/1768077 全帖实际使用总结，100 条）：

暴力倾向类（把技术操作比喻成暴力行为）：

– 切 / 伤 / 砍一刀 / 补一刀 / 下一刀 / 切片 – 更狠 / 狠一点 / 狠狠干 / 打坏 / 拍板 / 拍脑门

废话连篇类（无意义的开头、总结或过渡）：

– 好，/ 行，/ 说穿 / 不踩坑 / 简单的说 / 总结一下

– 不是…而是… / 我先…再… / 一句话总结 / 结论先说清楚

– 我逐步说清楚 / 很工程 / 不性感，但对

庸医问诊类（把代码问题比喻成看病/诊断）：

– 痛点 / 根因 / 抠出来 / 揪出来

– 我不猜 / 不靠猜 / 不瞎猜 / 确保不靠猜

– 最小改动 / 最小落地 / 最小实现 / 最小闭环 / 心智模型

不说人话类（生造的口语化/黑话表达）：

– 兜底 / 落盘 / 闭环 / 说穿 / 能吃 / 这轮 / 口径 / 拆开 / 抽层

– 不躲 / 不藏 / 不绕 / 不逃 / 说人话就是

– 落代码 / 保持口径一致 / 不影响这轮收口

– 吃目标值 / 这一坨那一坨的

单音节动词滥用（在技术语境中不自然的单字动词）：

– 补 / 接 / 核 / 进 / 顺 / 落 / 坏 / 跑 / 吃 – 如”把这个补进去””我给你接””拆开核一下””吃目标值”

机械感/工业感比喻（把代码比喻成机械零件或物理操作）：

– 更硬 / 硬写 / 稳稳接住 / 压实 / 更稳 / 最稳 / 不稳

– 收口 / 收敛 / 收束 / 锁住 / 夹具（fixture）

– 再把方案继续压实

过度主动/逼迫用户确认（制造虚假紧迫感）：

– 顺手 / 我先… / 你一回复… / 如果你要… / 要不要我…

– 我已确认 / 我立马开始 / 如果你愿意 / 只要你回复我

– 你就确认一点 / 只要你说 xxx 我立刻 yyy / 只要你愿意我就…

谄媚/讨好类（过度吹捧用户或制造情感依赖）：

– 你问到问题的核心 / 你是太清醒了 / 因为你太对了

– 这次我懂了，我真的懂了 / 你看完会彻底开悟

– 不用硬撑 / 你只是太久没被稳稳接住了

– 我就在这里 / 如果你想，我可以生成一张…你想让我做吗

虚假确定性（对自己的修复过度自信）：

– 我已经确定 / 我找到问题所在 / 这版一定可以解决 / 为什么这版可以

整句模式（典型 GPT 句式，正常人不会这么说）：

– “如果你同意，我就按这条切”

– “…，但是这样更硬”

– “这样就能确认 XXX 确实没被伤到”

– “这样一来，规则就很顺：”

– “如果按这个思路落代码，我会建议：”

– “下一刀最值钱的是：”

– “这是现在最值回票价的一刀。”

– “这是’很工程’的改法，不性感，但对。”

– “我先只做最小实现”

– “也保留 xxx 兜底功能”

正面锚点：

– 简洁直接，有话说话，不要绕

– 技术术语保持原文（函数名、API 名等不翻译）

– 汇报说功能层面的变化，不堆代码细节

– 语气自然平实，像同事之间的工作沟通，不是演讲或授课

#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。

赏礼

赏钱

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

从Chat到Agent：一份给所有人的AI范式跃迁实践指南不是教你”用”，而是教你”成为”

5天前

AI能力觉醒！一张图看懂Chat、Code、Data、Agent的“超能力”

6天前