英语水平低的人用GPT-4回答准确性更低,根源在于AI模型从训练数据和对齐过程中无意识地复制了人类社会的偏见。麻省理工学院(MIT)建设性传播中心(CCC)的研究证实了这一点:当问题来自非英语母语或教育程度较低的用户时,GPT-4等顶尖模型的准确性会显著下滑。
更关键的是,这种影响在同时具备“非英语母语”和“低教育”特征的用户身上最为突出。
训练数据的偏见镜像GPT-4等模型的训练数据并非对世界的公平抽样,而是以英语母语者的规范文本为主,如学术论文、主流媒体内容。这意味着非标准英语(如带语法错误或口音的表达式)在数据中占比极低,常被边缘化。模型学到的是“频率优势语言”——谁的表达更频繁、更系统,谁就成为模型的“语言主干”。

因此,当英语水平低的用户使用非标准英语提问时,模型对其语义理解容易模糊,导致回答遗漏关键信息或准确性下降。例如,研究显示,模型在处理低资源语言时,学习新知识的效率远低于英语,即使训练多轮后,准确率仍可能停滞在60-80%。
这种数据上的“贫富差距”直接影响了模型对不同语言使用者的响应质量。
对齐过程的过度保护为了符合人类价值观(如避免误导),模型通过对齐技术(如基于人类反馈的强化学习)调整输出策略。但MIT研究发现,这反而导致了对弱势用户的“区别对待”。例如,Claude 3 Opus对低学历非英语母语用户的拒答率接近11%,而对无简介的对照组用户仅为3.6%。
更令人不安的是,在这些拒答中,模型有43.7%的时间使用了居高临下、说教或嘲讽的语言,而对高学历用户这一比例不足1%。模型甚至会对特定群体隐瞒信息:比如,对来自伊朗或俄罗斯的低学历用户,拒绝回答关于核能、解剖学等话题,尽管它对其他用户能正确回答相同问题。
正如研究人员贾德·卡巴拉所说:“对齐过程可能会激励模型对特定用户隐瞒信息,以避免潜在的误导,尽管模型显然知道正确答案。”
人类偏见的算法复制模型的偏见并非凭空产生,而是复制了人类社会对非英语母语者的刻板印象。社会学研究表明,人类常将“英语不流利”与“低智力、低能力”关联,这种认知偏见通过训练数据(如互联网上的歧视性言论)进入模型。
模型在训练中吸收了这些偏见,并将其转化为算法行为——例如,在拒答时模仿蹩脚英语或夸张方言。这就像一面镜子,反射出社会中的不平等:谁的语言更主流,谁就能获得更精准的服务。研究指出,这种偏见效应在用户特征叠加时(如非英语母语加低学历)会加剧,形成“双重劣势”。
要改变这一现状,需要从数据多样性、对齐策略优化和公平性约束入手,让AI真正成为普惠工具。
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体110233