报告称谷歌搜索 AI 概览准确率约 90%,易被虚假信息操纵

来源:IT家人工智能 | 2026-04-08 11:00:08
IT之家 4 月 8 日消息,《纽约时报》昨日(4 月 7 日)发布博文,报道称谷歌 AI 概览(AI Overviews)的准确率约为 90%,但基于每年超 5 万亿次的搜索量,这意味着每小时可能产生超过 5700 万条错误答案,相当于每分钟近 100 万条。AI 初创公司 Oumi 使用 SimpleQA 基准评估谷歌搜索,在分析 4326 次搜索后,发现 Gemini 2 在 10 月的准确率为 85%,至今年 2 月,Gemini 3 将这一数据提升至 91%。然而,Oumi 的评估依赖 AI 工具,可能存在误差,且谷歌对同一查询有时会生成不同概览。例如搜索IT之家,跳出的 AI 概览介绍此外数据显示,AI 概览与来源不符的比例已从 Gemini 2 时期的 37% 升至 Gemini 3 的 56%。具体表现包括:错误概览后紧接着正确链接,或准确概览引用了错误信息。研究人员还发现 AI 概览易被操纵,有记者发布虚假博客后,谷歌次日便在概览中引用了相关内容。用户斯蒂芬 · 潘瓦西在查询摔跤手胡克 · 霍根(Hulk Hogan)的死讯时,AI Overviews 明确回复“没有可信报告显示霍根已去世”,但页面下方展示的文章标题却写着“霍根之死谜团加深”。这种自相矛盾的现象引发了用户对 AI 生成内容可靠性的质疑。谷歌发言人质疑 Oumi 的测试方法,认为其未能反映真实搜索行为。广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
“两高”划定“机闹”入刑红线 严惩危害飞行安全犯罪
特朗普为何解雇司法部长邦迪 车内告知“是时候了”
张雪接连夺冠引发骑行热 医生提醒 警惕慢性疾病隐患
辽阳弓长岭通报填埋车辆 封建迷信行为被严肃处理
网红一栗小莎子因癌症剃光头 勇敢面对8次化疗
《穿普拉达的女王2》璀璨之夜 梅姨与海瑟薇亮相
机器人夜跑姿势 未来已来
AI 预测英超联赛结果能力如何?报告称 Claude Opus 4.6 表现最佳,Grok 垫底
历时 160 天,中国第 42 次南极考察队暨“雪龙”号凯旋
北京4月9日早晨东部地区有小雨,白天阴有分散性小雨,最高气温14℃ 体感湿凉注意保暖