OpenAI砸钱招安全专家，AI到底在怕什么-工信会

> 自媒体 > （AI）人工智能 > OpenAI砸钱招安全专家，AI到底在怕什么

OpenAI砸钱招安全专家，AI到底在怕什么

来源：opendotnet

2026-06-01 18:48:24

管理

你可能刷到过这样一条新闻，OpenAI 正在高薪招募安全专家，专门应对 AI 自我进化带来的风险。

很多人看到这种新闻的第一反应是，又来炒作了。大厂嘛，招人不是很正常的事。

但我仔细想了想，这事没那么简单。

1. 招安全专家，为什么偏偏是现在

先说个背景。AI 安全这个概念，其实从 ChatGPT 爆火之前就有人在喊了。但过去两年，大家的注意力都在"AI 能做什么"上，安全问题基本处于雷声大雨点小的状态。

2024 年发生了一件标志性事件，OpenAI 的联合创始人兼首席科学家 Ilya Sutskever 离职了。这位老兄一直是公司内部最强调 AI 安全的人，他的离开一度被外界解读为 OpenAI 在安全方向上要收缩。

结果呢，2025 年 OpenAI 重新组建了安全团队，2026 年又开始大规模招人。

你想想看，一家估值几千亿美元的公司，在所有人都在追模型能力的时候，反手重金砸安全。这说明什么？

说明他们内部看到了一些让管理层真正紧张的东西。

2. AI 自我进化，不是科幻，是正在发生的事

这里需要解释一个概念，AI 自我进化（self-evolution），或者叫 self-improvement。

以前我们说 AI 厉害，指的是它能完成人类交给它的任务，写代码、画画、回答问题。但这些都是被动的，人给指令，AI 执行。

自我进化是什么意思呢，是 AI 能自己改进自己。它能分析自己的表现，找到弱点，调整策略，变得更强。而且这个过程不一定需要人类参与。

说真的，这个能力离成熟还有一段距离，但趋势已经很明显了。

2025 年底，多个实验室的研究显示，大语言模型在某些任务上已经展现出自我改进的迹象。比如用 AI 生成的数据来训练更强的 AI，用 AI 来评估和优化 AI 的输出。这些单独看都是正常的工程实践，但组合在一起，就构成了一个自我强化的循环。

我一直觉得，AI 行业最怕的不是技术突破太慢，而是技术突破来得太快、控制不住。

3. 这些安全专家，到底要干什么

你可能会好奇，这些百万年薪的安全专家，日常工作到底是什么。

不是坐在那里写安全规则、做合规检查那么简单。

他们要解决的核心问题是，当 AI 的行为变得越来越不可预测时，怎么确保它不会做出人类不想要的事情。

具体来说，有几个方向。

第一个叫对齐（alignment），就是让 AI 的目标跟人类的目标保持一致。听起来很简单对吧，但实际上这是 AI 领域最难的问题之一。你怎么确保一个比你聪明一万倍的系统，永远按照你的意愿行事？

第二个叫可控性（controllability），就是确保人类随时能介入、能叫停、能修改 AI 的行为。问题在于，当 AI 的推理过程越来越复杂，人类可能根本看不懂它在做什么。

第三个叫可解释性（interpretability），就是让 AI 能清楚地解释自己为什么做出某个决定。你想想，如果一个 AI 帮你做了投资决策但说不清逻辑，你敢信吗。

这些都不是纸上谈兵，而是正在发生的工程挑战。

4. 不只是 OpenAI，整个行业都在紧张

OpenAI 招人只是冰山一角。

Anthropic，就是做 Claude 那家公司，从成立第一天就把 AI 安全写进了公司使命。Google DeepMind 2025 年也扩充了安全团队的规模。连 Meta 的 AI 部门都在招安全研究员。

整个行业在安全方向上的投入，2025 年比 2024 年翻了接近一倍。

你想想看，如果这只是公关噱头，不可能所有头部公司同时行动。

说到底，这是因为 AI 的能力曲线拐了一个弯。过去几年，大家还在讨论 AI 能不能通过图灵测试。现在呢，讨论的已经是 AI 能不能自己改进自己、能不能在没有人类监督的情况下完成复杂任务。

这条能力曲线的斜率在变陡，安全问题的紧迫性自然也在上升。

5. 跟普通人有什么关系

好，重点来了。这些事跟我有什么关系，我又不是 AI 工程师。

关系比你想的要近得多。

第一，你用的每一个 AI 产品，背后都有安全决策。ChatGPT 为什么有时候拒绝回答你的问题，Claude 为什么有时候特别谨慎，这些都不是 bug，是安全团队设定的边界。安全团队越强，这些边界越合理。安全团队弱了，要么太松出事，要么太紧没法用。

第二，AI 的能力越强，犯错的代价越大。当 AI 只是个聊天机器人时，说错话顶多尴尬一下。但当 AI 被用于医疗诊断、金融决策、自动驾驶时，一个错误可能就是真金白银甚至人命关天。安全专家要做的，就是在这些高风险场景下建立足够的护栏。

第三，也是我觉得最重要的一点。AI 安全的讨论，本质上是在回答一个问题，我们到底想让 AI 做什么。

这是一个技术问题，但更是一个社会问题。

6. 安全不是刹车，是方向盘

说个我自己的观察。

很多人把 AI 安全理解成"给 AI 加限制"，觉得安全就是刹车，会让 AI 变慢变笨。

这是一个特别大的误解。

好的安全机制不是刹车，是方向盘。它不是让 AI 停下来，而是让 AI 往对的方向跑。

举个例子，Anthropic 的宪法 AI（Constitutional AI）就是一种安全技术，它让模型在训练过程中学会一套行为准则，然后在推理时自动遵守。这不是限制，是引导。

OpenAI 现在招的安全专家，做的也是类似的事。他们不是要把 AI 锁在笼子里，而是要建立一套机制，让 AI 在变得越来越强大的同时，始终跟人类的利益保持一致。

这件事的难度在于，你不能等到 AI 真的失控了再补救。你必须提前布局。

这就像造飞机，安全标准必须在飞机上天之前定好，不能等坠机了再加安全带。

7. 我们正在见证一个拐点

说实话，我也不确定 AI 安全最终能不能做好。

但 OpenAI 这次大规模招人，至少说明了一件事，行业终于从"AI 能做什么"转向了"AI 应该做什么"。

这个转变比任何一次模型升级都重要。

因为模型升级解决的是能力问题，而安全建设解决的是方向问题。能力再强，方向错了就是灾难。

说真的，作为普通用户，我们能做的也有限。但至少可以保持关注，保持清醒。

下次你看到某个 AI 产品突然变得特别保守、拒绝回答某些问题时，别急着骂它笨。想想背后的安全团队可能正在做一道特别难的选择题。

愚钝如我，也慢慢明白了，技术从来不是中性的，它需要有人守住底线。

OpenAI 花大价钱找的那些安全专家，就是在守这条底线。

而这条底线，跟每一个用 AI 的人都有关。

赏礼

赏钱

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

Kimi爆发收入背后：OpenClaw重构企业AI应用范式和商业模式

2小时前

AI世纪审判：马斯克状告OpenAI

3小时前