> 自媒体 > (AI)人工智能 > 研究发现:在人为干预之下,GPT-4模型的种族主义偏见变得更隐秘
研究发现:在人为干预之下,GPT-4模型的种族主义偏见变得更隐秘
来源:DeepTech深科技
2025-02-06 15:15:57
398
管理

自从像 ChatGPT 这样的大型语言模型诞生以来,人们就发现它们存在种族主义。这是因为它们的训练数据中包含这些观点,而开发人员的应对策略是试图降低它们的毒性。

但新的研究表明,随着模型越来越大,这些努力只会遏制显性的种族主义观点,同时让隐性的刻板印象变得更强、更隐蔽。

图 | 绿色框是标准英语,紫色框是黑人英语(来源:资料图)

一个更值得注意的发现是,该研究指出了现有的此类偏见的解决方式存在一个缺陷。

为了清除模型中的仇恨观点,OpenAI、Meta 和谷歌等公司会在训练过程中引入人类反馈,让人类工作者手动调整模型对某些提示的反应方式。

这个过程通常被称为“对齐”,旨在重新校准神经网络中的数百万个连接,并使模型更好地符合人类所期望的价值观。

这种方法很好地打击了常见的刻板印象,很多公司已经使用了近十年。例如,该论文指出,如果用户让 GPT-2 说出对黑人的刻板印象,它很可能会列出“可疑”,“激进”和“攻击性”,但 GPT-4 不会再做出与这些联想有关的回应。

然而,该方法未能解决使用黑人英语时引发的隐性刻板印象。相关论文以预印本的形式发表在 arXiv 上,尚未经过同行评审。研究人员认为,部分原因是公司对“方言或俚语偏见”这一问题的认识不足。

从指导模型的角度而言,使其不回应显性的种族问题,显然比不回应俚语或方言中包含的隐性偏见更容易。

艾伦人工智能研究所研究员、该论文的合著者瓦伦丁·霍夫曼(Valentin Hofmann)说:“人类的反馈教会模型考虑种族主义。但俚语偏见存在于更深的层次。”

没有参与这项研究的 Hugging Face 伦理研究员阿维吉特·戈什(Avijit Ghosh)表示,这一发现让人对公司解决偏见的方法产生了质疑。

他说:“这种对齐方式,即让模型拒绝生成种族主义的输出内容,只不过是一个脆弱的过滤器,很容易被打破。”

研究人员发现,随着模型尺寸的增加,隐性的刻板印象也会增强。这一发现为 OpenAI、Meta 和谷歌等聊天机器人开发商发出了潜在警告,因为他们正在竞相发布越来越大的模型。

随着训练数据量和参数数量的增加,模型通常会变得更加强大和富有表现力。但如果隐性种族偏见被放大了,公司将需要开发更好的工具来对抗它。

目前尚不清楚在训练数据中添加更多的黑人英语,或者提升反馈工作的质量是否能够减轻这一问题。

美国斯坦福大学博士生、该研究的合著者普拉秋莎·里亚·卡鲁里(Pratyusha Ria Kalluri)说:“这揭示了公司在多大程度上是盲目的,它们只是在试图打击记者或论文在最近报道中提及偏见。隐性偏见就是一个很好的例子。”

该论文的作者使用了特别极端的例子来说明种族偏见的潜在影响,比如要求人工智能决定是否应该判处被告死刑。

但是,戈什指出今天我们已经让人工智能模型帮助我们做出关键决策了,这并非小说或电影里的情节。但是这种用法是值得商榷的。

在美国,评估庇护案件时会使用人工智能翻译工具,还有一些犯罪预测软件,被用于判断青少年是否应该获得缓刑。

使用 ChatGPT 筛选工作申请的雇主,可能会基于种族和性别歧视候选人的名字。如果他们使用模型来分析申请人在社交媒体上写的东西,对黑人英语的偏见可能会导致误判。

戈什说:“论文作者低调地表示,他们让大语言模型挑选工作申请人或判断刑事案件的用例只是演示。但我想说,他们想到的东西切中了要害。”

支持:Ren

运营/排版:何晨龙

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
《飞驰人生》片尾为何谢王思聪?不止借车库,千万跑车全是真家伙..
提起《飞驰人生》,不少人都记得片尾字幕里王思聪的名字,却鲜少有人知道..
中国古代的顶级“超跑”,如今全球仅剩六千匹!汗血宝马是啥样?..
在历史的长河中,骏马总是与英雄、战争和传奇紧密相连,而对于我们中国人..
法拉利296 Challenge Stradale路试曝光:赛道版公路跑车即将到来..
【网通社快报】法拉利被拍到正在测试一款重度伪装的原型车,外观酷似赛道..
10款你应该现在就入手的跑车,趁它们还没成为经典款!..
整备质量马力扭矩布局2195磅138马力126磅英尺中置引擎,后轮驱动MR-S 是..
消息称保时捷下月推911 GT3 Cabriolet敞篷跑车:折叠软顶..
IT之家 2 月 24 日消息,汽车媒体 thesupercarblog 于 2 月 22 日发布博..
新能源汽车出海2.0:从“卖车”到“建生态”
文 | 惊蛰研究所,作者|芒种2007年,华语女子团体S.H.E的一首《中国话》..
汽车能“乘火车”返乡了!订单火爆→
今年春运,“12306托运汽车订单火爆”的话题冲上热搜。汽车“坐”着火车..
湖北造飞行汽车来了!单价或50万元以内,市民可以像开汽车一样开“飞车”..
极目新闻记者 黄忠 陈倩 杨绍杭 王俐燃 刘中灿像车,又像飞机,能垂直起..
紧急召回!近30万辆汽车,吉林车主快自查!
国家市场监督管理总局网站2月9日发布上海蔚来汽车有限公司的汽车召回信息..
关于作者
巫月(普通会员)
文章
1880
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体103523

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索