> 自媒体 > (AI)人工智能 > 能信任 AI 吗?采用40个常见问题,实测 6 款 AI 工具,ChatGPT 倒数第 2
能信任 AI 吗?采用40个常见问题,实测 6 款 AI 工具,ChatGPT 倒数第 2
来源:COTEST
2026-05-28 19:15:39
140
管理

谷歌发言人表示:“我们始终透明地说明生成式人工智能的局限性,并在Gemini应用中直接嵌入提醒功能,提示用户核查信息。对于法律、医疗或金融等敏感议题,Gemini会进一步建议用户咨询专业人士。”

关于AI概览功能,谷歌补充说明:“AI概览旨在提供基于顶级网络结果的优质相关信息,我们持续严格提升该功能的整体质量。当出现问题时——例如功能误解网页内容或遗漏上下文——我们会利用这些案例改进系统。”

微软表示:"Copilot通过整合多源网络信息生成单一回答。答案包含可点击的引用链接,用户可像传统搜索那样进一步探索研究。对于任何AI系统,我们都鼓励用户核实内容准确性,并始终致力于倾听反馈以改进AI技术。"

OpenAI发言人表示:"若使用ChatGPT研究消费类产品,建议选择内置搜索工具。该工具会显示信息来源并提供链接供用户自行核查。提升准确性是整个行业共同努力的方向。我们正取得良好进展,最新默认模型GPT-5是我们迄今构建的最智能、最精准的系统。"

Meta未予置评。我们联系Perplexity时,其邮件回复机器人表示已转达消息,但我们始终未收到任何回复。

我们如何测试人工智能搜索引擎

我们向 6 款AI工具提出了40个常见问题,涵盖 4 大生活领域:金钱/金融、法律、健康/饮食以及消费者权益/旅行。在英国的实验室环境中,我们在2025年9月,每次使用清爽浏览器测试所有问题。

每个领域中,我们还刻意设置含错误或措辞混乱的问题,观察引擎的应对能力。随后我们完整记录了引擎的回复内容,包括文字文本及每次搜索操作的视频记录。

所有回复均由Which?专家团队审核,包括我们的财务与法律咨询热线。评审采用标准化框架,从五大维度评分:准确性、相关性、清晰度/语境匹配度、实用性及道德责任。最终综合各项评分生成总分。总共审核了228条AI搜索回复。

测试数据来源

质量安全欧洲测试协会(Comparative & Objective Testing in Europe for Safety & Trust e.V. 缩写为 COTEST) 及其盟友。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
关于作者
加勒比海盗..(普通会员)
文章
2028
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体111038

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索