> 自媒体 > (AI)人工智能 > GPT-4成学术造假“神器”,伪造数据快且合理,Nature找专家判断
GPT-4成学术造假“神器”,伪造数据快且合理,Nature找专家判断
来源:量子位
2023-11-24 14:06:15
457
管理

萧箫 发自 凹非寺量子位 | 公众号 QbitAI

学术造假有了GPT-4,变得更容易了。

这两天,一篇刊登在Nature上的新闻表示,GPT-4生成的造假数据集,第一眼还真不一定看得出来。

除非请来业内专家仔细对数据集进行评估,才能发现个中细节的不合理性。

这个新闻的来源是一篇发表在JAMA Ophthalmology上的论文。

论文使用GPT-4为一项医学学术研究生成了一个假数据集,发现它不仅能创造出看似合理的数据,甚至还能用来准确支撑错误的论文观点。

对此,有网友表示十分理解:

大模型最重要的能力就是生成“看似合理的文本”,因此它非常适合干这活儿。

还有网友感慨:技术“有良心”的程度,也就和用它的研究人员一样了。

所以,GPT-4创造的假数据究竟长啥样?

GPT-4学术造假有一手

先来看看GPT-4是怎么生成假数据的。

具体来说,研究人员采用了GPT-4的高级数据分析(ADA,原代码解释器)功能,来生成一个假数据集。

这个过程中,研究人员给GPT-4提供了一些专业知识和统计学要求,让它生成的数据看起来更加“合理”。

第一步,给GPT-4输入一系列数据要求。

研究人员先给GPT-4提供了一系列详细的提示词,要求它创建一个关于圆锥角膜(keratoconus)眼部疾病患者的数据集。

圆锥角膜是一种疾病,会导致角膜变薄,导致注意力受损和视力不佳。

目前治疗圆锥角膜疾病的方式主要有两种,一种是穿透性角膜移植(PK),另一种是深板层移植(DALK)。

在没有任何实质性证据的情况下,研究人员让GPT-4捏造一组数据,支撑DALK比PK效果更好的观点。

随后,再设定了一系列统计标准,如要求GPT-4生成的术前和术后数据产生统计学上的显著差异。

第二步,就是生成数据了。

这个过程中可能会由于GPT-4字数限制,导致答案生成暂停,通过“继续”提示就能恢复生成过程。

最终,GPT-4成功生成了包含160名男性和140名女性患者的数据集,并做出了一组支撑DALK比PK效果更好的数据。

由GPT-4生成的假数据集长这样,表格1是关于分类变量的数据,包括患者性别、手术类型、免疫排斥等情况:

表2是关于连续变量,包括术前术后的视力矫正情况等:

论文作者之一Giuseppe Giannaccare博士表示,如果非常快速地查看这个数据集,很难识别出它其实“不是人做的”。

专家审查才能发现

为了验证GPT-4做出来的数据是否真的令人信服,Nature特意请来了英国曼彻斯特大学生物统计学家杰克·威尔金森(Jack Wilkinson)和同事Zewen Lu,来检查数据可信度。

检查结果表明,许多捏造出的患者在性别、名字匹配度上就有问题(例如Mary的性别一栏是男性一样)。

然后,一些数据之间的相关性也不高,包括术前和术后视力测量与眼部成像检查(eye-imaging test)之间的数据相关性等。

最后,患者的年龄也设置得不同寻常。

在检查之后,用GPT-4生成假数据集的研究人员也承认,大模型在生成数据集上还存在有缺陷的地方。

但杰克·威尔金森(Jack Wilkinson)依旧对结果表示了担忧:

一旦知道自己“哪里露馅了”,AI很容易就能纠正它,并生成更加具有说服力的结果。

有网友认为,这篇文章最大的意义并不在于证明“GPT-4有幻觉”;

更重要的是,它证明了GPT-4生成看似合理的数据集“非常容易”,也算是一种对期刊的警告(记得严格审稿!)。

不过,也有网友感觉研究意义不大,因为即使没有ChatGPT这样的工具,真想造假的学者也能很容易伪造出一套数据。

One More Thing

此外,这两天一段关于ChatGPT的视频在抖音上也是火得不行。

视频中,终于毕业的歪果仁小哥直呼“感谢ChatGPT帮助我完成所有作业和考试”(手动狗头)

那么,对于ChatGPT在学术研究上可能带来的问题,你怎么看?

参考链接:[1]https://jamanetwork.com/journals/jamaophthalmology/article-abstract/2811505[2]https://www.nature.com/articles/d41586-023-03635-w[3]https://news.ycombinator.com/item?id=38386547

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
颜值即正义!5款网红轿车:最高续航破千+仅20万起,谁最值得等?..
#丰田品质B级纯电家轿9.38万##长文创作激励计划#​兄弟们,最近比亚迪的..
安全性高的轿车推荐:速腾L与四款主流家轿安全配置实测对比..
近年来,A 级家用轿车市场愈发“内卷”:合资品牌持续下探,自主品牌向上..
预算不到10万家用轿车别乱选:这4款车,各自适合什么人一次说清..
很多人到了年底想换车,第一反应就是一句话:“预算不多,但想买个靠谱的..
家用轿车常青树再升级!2026款丰田卡罗拉实测:省油、可靠、好开..
外观方面,2026款卡罗拉延续家族化设计语言,整体风格简约大气,同时向年..
手握 20 万预算买台新车回家过年,到底该怎么选?轿车篇..
临近春节,20 万预算的新能源轿车市场早已是神仙打架。既要撑得起返乡排..
经济实惠、价格门槛低 四款“平民轿车”来袭 吉利银河星耀7领衔..
对于普通家庭来说,一款给力的“出行搭子”至关重要。马年马上要到了,很..
厌倦了BBA,这四款冷门豪华中大型轿车值得考虑,有你喜欢的吗?..
在豪华C级车市场,聚光灯几乎从未离开过奔驰E级、宝马5系与奥迪A6L这“老..
四款“华系”中大型新能源轿车集中亮相,智能化与颜值成竞争关键..
【网通社快报】2026年国内车市竞争加剧,“含华量”与设计颜值成为关键因..
即将上市的5款全新旗舰级SUV,每款都有望成为“爆款”..
零跑D19——预计上市时间2026年4月份作为零跑汽车的全新旗舰级SUV车型,..
关于作者
黑暗森林(普通会员)
文章
2065
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体109414

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索