
谷歌发言人表示:“我们始终透明地说明生成式人工智能的局限性,并在Gemini应用中直接嵌入提醒功能,提示用户核查信息。对于法律、医疗或金融等敏感议题,Gemini会进一步建议用户咨询专业人士。”
关于AI概览功能,谷歌补充说明:“AI概览旨在提供基于顶级网络结果的优质相关信息,我们持续严格提升该功能的整体质量。当出现问题时——例如功能误解网页内容或遗漏上下文——我们会利用这些案例改进系统。”
微软表示:"Copilot通过整合多源网络信息生成单一回答。答案包含可点击的引用链接,用户可像传统搜索那样进一步探索研究。对于任何AI系统,我们都鼓励用户核实内容准确性,并始终致力于倾听反馈以改进AI技术。"
OpenAI发言人表示:"若使用ChatGPT研究消费类产品,建议选择内置搜索工具。该工具会显示信息来源并提供链接供用户自行核查。提升准确性是整个行业共同努力的方向。我们正取得良好进展,最新默认模型GPT-5是我们迄今构建的最智能、最精准的系统。"
Meta未予置评。我们联系Perplexity时,其邮件回复机器人表示已转达消息,但我们始终未收到任何回复。
我们如何测试人工智能搜索引擎我们向 6 款AI工具提出了40个常见问题,涵盖 4 大生活领域:金钱/金融、法律、健康/饮食以及消费者权益/旅行。在英国的实验室环境中,我们在2025年9月,每次使用清爽浏览器测试所有问题。
每个领域中,我们还刻意设置含错误或措辞混乱的问题,观察引擎的应对能力。随后我们完整记录了引擎的回复内容,包括文字文本及每次搜索操作的视频记录。
所有回复均由Which?专家团队审核,包括我们的财务与法律咨询热线。评审采用标准化框架,从五大维度评分:准确性、相关性、清晰度/语境匹配度、实用性及道德责任。最终综合各项评分生成总分。总共审核了228条AI搜索回复。
测试数据来源质量安全欧洲测试协会(Comparative & Objective Testing in Europe for Safety & Trust e.V. 缩写为 COTEST) 及其盟友。
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体111038