OpenAI周二宣布,它将很快让家长将账户与他们的青少年联系起来,制定适合年龄的规则,并在ChatGPT检测到“急性痛苦”时收到警报

OpenAI表示,家长将能够将他们的帐户与孩子的帐户链接起来,为ChatGPT的响应设置适合年龄的规则,并管理机器人的内存和聊天历史等功能。
OpenAI表示,家长们很快就会对他们的青少年在ChatGPT上做什么有更多的监督。
在周二发表的一篇博客文章中,这家人工智能公司扩大了其计划,让ChatGPT在检测到用户可能导致伤害的潜在心理健康危机时,更早地在更广泛的情况下进行干预。
该公司宣布这一消息的一周前,OpenAI遭遇了第一起非正常死亡诉讼,来自加利福尼亚州的一对父母,他们声称ChatGPT对他们16岁儿子的自杀负有责任。
OpenAI在周二的帖子中没有提到这名青少年Adam Raine。然而,在提起诉讼后,该公司暗示即将发生变化。
OpenAI表示,在下个月内,父母将能够对青少年使用ChatGPT进行更多控制。该公司将允许家长将他们的帐户与孩子的帐户链接起来,为ChatGPT的响应设置适合年龄的规则,并管理机器人的内存和聊天历史等功能。
根据OpenAI的博客文章,当ChatGPT检测到他们的孩子“处于极度痛苦的时刻”时,家长们也将很快收到通知。这将是促使ChatGPT将未成年人的对话标记为成年人的第一个功能,一些家长一直在要求采取这一措施,因为他们担心聊天机器人本身无法缓解危机时刻。
根据Adam Raine家人的诉讼,今年早些时候,当Adam Raine告诉GPT-4o他的自杀意念时,机器人有时会积极劝阻他寻求人际关系,主动提出帮助他写自杀遗书,甚至建议他设置套索。ChatGPT确实多次提醒亚当自杀热线号码,但他的父母说,这些警告很容易让他们的儿子绕过。
在Raine非法死亡诉讼的消息传出后,OpenAI在之前的一篇博客文章中指出,其现有的保障措施旨在让ChatGPT给出同理心的反应,并将用户引导到现实生活中的资源。在某些情况下,如果ChatGPT检测到对自己或他人造成身体伤害的计划,对话可能会被路由给人工审阅者。
该公司表示,它计划在更长的对话中加强保障措施,因为历史上护栏更容易倒塌。
“例如,当有人第一次提到意图时,ChatGPT可能会正确地指向自杀热线,但在很长一段时间内发出许多信息后,它最终可能会提供一个与我们的保障措施相悖的答案,”它写道。“我们正在加强这些缓解措施,以便在长时间对话中保持可靠,我们正在研究如何确保在多个对话中保持稳健的行为。”
这些措施将增加OpenAI上个月推出的心理健康护栏,此前它承认GPT-4o“在识别妄想或情绪依赖的迹象方面做得不够”8月份推出的GPT-5还带来了新的安全限制,旨在防止ChatGPT在无意中给出有害的答案。
针对OpenAI的声明,Raine家族的首席法律顾问Jay Edelson表示,OpenAI首席执行官Sam Altman“要么明确表示他认为ChatGPT是安全的,要么立即将其从市场上撤出。”
埃德尔森在一份声明中表示,该公司选择做出“模糊的承诺”,而不是作为紧急行动将产品下线。
“不要相信:这只不过是OpenAI的危机管理团队试图改变话题,”他说。
一系列以安全为重点的更新发布之际,OpenAI正面临越来越多的审查,因为有报道称,严重依赖ChatGPT提供情感支持和生活建议的人会产生人工智能驱动的妄想。OpenAI一直在努力控制ChatGPT过度取悦用户的行为,尤其是在该公司试图让GPT-5不那么讨好之后,一些用户在网上暴动。
Altman承认,与以前的技术相比,人们似乎对人工智能机器人产生了“不同且更强”的依恋。
Altman上个月在一篇X帖子中写道:“我可以想象,在未来,很多人都会真正信任ChatGPT对他们最重要决策的建议。”。“虽然这可能很棒,但这让我感到不安。但我预计它会在一定程度上到来,很快数十亿人可能会以这种方式与人工智能交谈。”
在接下来的120天里,ChatGPT将开始将一些敏感的对话,比如那些显示用户“极度痛苦”迹象的对话,路由到OpenAI的推理模型,这些模型在回答之前会花更多的时间思考和处理上下文。
根据OpenAI的博客文章,内部测试表明,这些推理模型更一致地遵循安全准则。
该公司表示,将依靠其“幸福专家委员会”来帮助衡量用户幸福感,确定优先事项并设计未来的保障措施。据OpenAI称,该咨询小组由青年发展、心理健康和人机交互领域的专家组成。
该公司在其博客中写道:“虽然委员会将就我们的产品、研究和政策决策提供建议,但OpenAI仍对我们做出的选择负责。”。
该委员会将与OpenAI的“全球医生网络”合作,该网络由250多名医生组成,该公司表示将利用他们的专业知识为其安全研究、模型培训和其他干预措施提供信息。
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体103513