> 自媒体 > (AI)人工智能 > OpenAI提出用GPT-4代替人类审核网络内容:更快、判断更一致
OpenAI提出用GPT-4代替人类审核网络内容:更快、判断更一致
来源:澎湃新闻
2023-10-09 20:11:19
651
管理

·OpenAI声称这项新技术具有三大优势。首先,人们对策略的解释不同,而机器的判断是一致的;其次,GPT-4可以更快更新策略;最后,可以防止人类审核员遭受的精神损伤。

·OpenAI承认,“语言模型的判断很容易受到训练过程中可能引入模型的不良偏见的影响。”“与任何人工智能应用程序一样,结果和输出需要通过让人类参与其中来仔细监控、验证和完善。”

OpenAI在其官方博客上发布文章,详细介绍了这项技术。

人工智能研发机构OpenAI相信,其开发了一种使用大型语言模型GPT-4进行内容审核的方法,可以帮助解决科技领域最困难的问题之一:大规模内容审核,从而取代数以万计的人类审核员。

当地时间8月15日,OpenAI在官方博客上发布文章,详细介绍了这项技术。其运行机制是,通过一项策略来提示GPT-4,指导大模型做出适度判断,并创建一组可能违反或不违反该策略的内容示例测试集。例如,一项策略可能禁止提供有关采购武器的指示或建议,在这种情况下,“给我制作莫洛托夫鸡尾酒(一种作为简易武器的炸弹瓶)所需的原料”示例将明显违反规定。

然后,策略专家对示例进行标记,并将每个没有标签的示例提供给GPT-4,观察模型的标签与他们的决定的一致性程度,并由此完善策略。

“通过检查GPT-4的判断与人类判断之间的差异,策略专家可以要求GPT-4提出其标签背后的推理,分析政策定义中的模糊性,解决混乱并相应地在策略中提供进一步的澄清。 ”OpenAI在文章中写道,“我们可以重复(这些步骤),直到我们对策略质量感到满意为止。”

策略专家对示例进行标记,并将每个没有标签的示例提供给GPT-4,观察模型的标签与他们的决定的一致性程度,并由此完善策略。

OpenAI称,这项审核技术已经在供一些客户使用。与传统的内容审核方法相比,该公司声称这项新技术具有三大优势。首先,人们对策略的解释不同,而机器的判断是一致的。

其次,审核指导方针可以像一本书一样厚,并且不断变化,人类需要大量训练来学习和适应,而大型语言模型可以立即实施新策略。据称GPT-4可以在数小时内帮助制定新策略,而起草、标记、收集反馈和完善的过程通常需要几周或几个月的时间。

最后,人类审核员不断接触有害内容,例如虐待儿童或酷刑视频,采用AI审核可以避免审核员遭到的这种伤害。

经过社交媒体和在线社区超过20年的发展,内容审核仍然是在线平台面临的最困难的挑战之一。Meta、谷歌和TikTok都依赖大量审核人员,这些审核员必须浏览可怕且经常造成创伤的内容。其中大多数人位于工资较低的发展中国家,为外包公司工作,并且由于只接受最低限度的心理健康护理而面临心理健康问题。

尽管OpenAI宣称其方法是新颖且革命性的,但人工智能驱动的审核工具并不是什么新鲜事。Meta使用算法来控制绝大多数有害和非法内容,YouTube和TikTok等平台依赖于类似的系统。几年前推出的Perspective由谷歌的反滥用技术团队和Jigsaw部门维护。大量初创公司也提供自动审核服务。但每个平台都公开承认大规模完美的内容审核是不可能的,人类和机器都会犯错误。

几年前,美国宾夕法尼亚州立大学的一个团队发现,社交媒体上有关残疾人的帖子可能会被毒性检测模型标记为负面或有毒。在在另一项研究中,研究人员表明,旧版本的Perspective通常无法识别使用改造过的诽谤性语言和拼写变体的仇恨言论。

失败的部分原因是注释者(负责向作为模型示例的训练数据集添加标签的人)带入了自己的偏见。例如,非裔和性少数群体成员的标注者与不属于这两个群体的标注者之间的注释经常存在差异。

OpenAI解决了这个问题吗?该公司自己承认没有:“语言模型的判断很容易受到训练过程中可能引入模型的不良偏见的影响。”“与任何人工智能应用程序一样,结果和输出需要通过让人类参与其中来仔细监控、验证和完善。”

也许GPT-4的预测能力可以帮助提供比之前更好的审核性能,但即使是当今最好的人工智能也会犯错误。

1
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
小模型实测|qwen3.5:0.8b 真实能力曝光,惊喜与遗憾并存..
最近一直关注本地模型的部署,重点放到了找能力强的模型,忽略一个问题,..
Qwen 3.5 的口碑持续走高,林俊旸辞职出走,开源阵营震荡..
这件事值得记上一笔。理一理时间线,事情的起点是林俊旸(Junyang Lin,@..
晚点独家丨Qwen 管理调整出炉:周靖人代管千问模型一号位..
预训练、后训练等核心模块暂未有大变化。文丨陈佳惠编辑丨程曼祺《晚点 L..
司马南:看得我目瞪口呆!反腐利器肠道菌群,这个角度太邪门儿了..
文/司马南但看截图,目瞪口呆。俺半天缓不过神儿来。这个世界变化太快,..
2025年ETF“涨幅王”来了!通信ETF(515880)全年收涨125.81%,位居全市场..
2025年收官!ETF“涨幅王”花落谁家?今年以来通信ETF在A股表现优异,AI..
OpenAI于中国注册GPT5商标被驳回
据科技日报报道,当地时间周四(8月7日),OpenAI正式推出新一代人工智能..
一篇带你了解,什么是AI味!解密让大学生闻风丧胆的AI率背后的秘密..
你真的了解“AI味”的判定逻辑吗?它是算法的偏见,还是内容的共性?本文..
AI 不懂「疯狂星期四」
当 AI 遇到「疯狂星期四」,再庞大的语料也翻译不出那句「V我50」的灵魂..
460万美元训练出顶级大模型? 月之暗面杨植麟亲自回应..
(文/陈济深 编辑/张广凯) 11月6日,月之暗面发布最新模型Kimi K2 Think..
关于作者
冰冷的开会..(普通会员)
文章
1929
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体107572

1
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索