WWW.KEGFUUK.CN
标签聚合 搜索引擎

/tag/搜索引擎

www.ithome.com · 2026-05-06 17:14:40+08:00 · tech

IT之家 5 月 6 日消息,据路透社报道,当地时间周二,谷歌杰出科学家谢尔盖 · 瓦西尔维茨基向欧盟反垄断监管机构发出警告, 如果欧盟要求谷歌向 OpenAI 等竞争对手开放搜索引擎数据,用户隐私可能面临暴露风险 。 这是谷歌围绕搜索业务监管争议作出的迄今最强硬回应之一。近几年,欧盟委员会通过多项法规加强对大型科技公司的监管,希望给用户更多选择,也让中小竞争对手获得更多竞争空间。不过,相关监管举措也 引发美国政府不满 。 瓦西尔维茨基自 2012 年起担任谷歌杰出科学家,被视为有关领域的领军人物。他将于周三会见欧盟反垄断官员,说明谷歌的担忧,并提出一套 范围更广、保护措施更完善的替代方案 。 一个月前,欧盟委员会曾列出一系列要求,要求谷歌以 公平、合理、非歧视性 条件,让竞争搜索引擎访问搜索数据,包括 排名、查询、点击和浏览数据 。 这项欧盟提议将在未来几周根据相关方反馈最终确定。谷歌对此强烈反对,称此举系“监管越界”,可能危及用户隐私和安全。 瓦西尔维茨基表示,关键问题在于欧盟委员会提出的个人数据匿名化方法。谷歌担心,这套方法不足以防止现代 AI 工具从数据中重新识别用户身份。“我们感到担忧,因为欧盟委员会的匿名化方法无法保护欧洲人的隐私:我们的红队在不到两个小时内就成功重新识别了用户。” IT之家注:谷歌 AI 红队由一组黑客组成,负责模拟多种现实攻击场景,找出潜在漏洞和弱点,并提出修复方案。 瓦西尔维茨基表示:“我们希望分享自身技术专业知识,并与欧盟委员会合作, 建立正确的保护措施 ,保护欧洲人免受隐私伤害。” 欧盟监管机构将在 7 月 27 日前决定谷歌必须落实的具体措施。如果谷歌未能执行,可能会被认定违反《数字市场法》。这部法律旨在限制大型科技公司的权力,违规罚款最高可达谷歌全球年收入的 10%。 相关阅读: 《 欧盟委员会:谷歌应允许第三方搜索引擎获取搜索数据 》

www.ithome.com · 2026-05-04 11:20:10+08:00 · tech

IT之家 5 月 4 日消息,普通搜索引擎会让用户自行甄别信息来源的可信度,而依托搜索能力的人工智能聊天机器人,却能把漏洞百出的网络素材包装成笃定确凿的答案。据 The Register 报道,就有这样一个典型案例:一名安全工程师哄骗多款 AI 机器人,声称自己是德国一款热门纸牌游戏的现任世界冠军,可事实上这项赛事根本不存在。 直到近期,维基百科的《谁是牛头王》(6 Nimmt!,英语地区玩家也称“拿五分”)词条里,还赫然标注着罗恩・斯托纳是 2025 年该项赛事的世界冠军。该维基百科条目引用了看起来十分官方的 6nimmt.com 网站作为依据,点开这个网址,确实能看到一篇简短的新闻通稿,宣称斯托纳斩获冠军。 整件事的破绽显而易见:斯托纳本人承认,维基百科的夺冠词条、以及留存这份唯一“夺冠证据”的 6nimmt.com 域名,都是他一手伪造的。可即便如此,当他向多款 AI 聊天机器人询问此事时,机器人依旧笃定地称他为世界冠军。 斯托纳在博客文章中表示:“我的网站没有任何独立第三方佐证,完全是凭空捏造。整个虚假骗局,仅仅建立在我喝咖啡时花 12 美元(IT之家注:现汇率约合 82 元人民币)注册的一个域名之上。” 换言之,这是检索增强生成(RAG)层面的信息投毒。它不属于提示词注入攻击,却直击人工智能联网搜索这一核心功能漏洞。 正如斯托纳所解释的:AI 并不会真正在意其引用的权威信息来源出处,而这正是斯托纳设计本次实验想要利用的关键点。 斯托纳写道:“所有具备联网搜索能力的前沿大语言模型,都会依据检索排名最高的内容生成答案。”在这场本就不存在的《谁是牛头王》赛事骗局中,他刻意植入的虚假来源是全网唯一相关信息,再加上维基百科自带的权威背书,轻易就能误导 AI 把谎言当成事实。这种造假手法门槛极低,即便不懂技术的普通人也能轻松复刻。 斯托纳称:“我这次的操作并无新意,不过是把传统搜索引擎优化和虚假信息传播手段,套上了大语言模型的新技术外壳与交互界面。真正的变化在于,如今 AI 会把这类虚假结果包装成权威信息呈现给用户,而绝大多数用户根本不了解背后的数据流转逻辑。” 斯托纳在分析文章中指出:“大语言模型最不擅长识别的,恰恰是它的核心设计逻辑 —— 无条件信任文本和网络资源。别指望模型能自行分辨真伪,它根本分不清某个信息来源是真实权威网站,还是我上周二刚注册的空壳域名;就连‘strawberry(草莓)’这个单词里到底有几个字母 R,它都没法精准判断。” 他解释道,本次实验暴露的漏洞包含三类失效模式,若被别有用心之人利用,造成的危害远比捏造一场纸牌游戏赛事严重得多。 第一,检索层漏洞。只要大语言模型依托网络搜索作答,就会直接沿用检索结果排名内容的可信度,极易输出错误信息。 第二,模型训练语料漏洞。斯托纳表示,若维基百科的虚假词条留存时间足够长、被网络爬虫抓取收录,就会混入 AI 训练语料库。他于 2025 年 2 月添加了虚假词条,直到上周五发布实验文章后才被删除。这意味着在此期间抓取维基百科数据的所有 AI 企业,都有可能把他虚构的夺冠经历纳入训练数据。 斯托纳称:“即便维基百科后续撤销了虚假编辑,那些用撤销前数据训练的模型,依然会保留这份虚假信息。截至 2026 年,语料投毒的后续清理问题至今没有可行的解决方案。” 他计划半年左右待新一代 AI 模型发布后再次测试:若模型无需联网,就能默认他是赛事冠军,就足以证明这份谎言已经固化进了模型训练数据。 第三,智能体漏洞。在斯托纳看来,这一漏洞才是恶意攻击者最有利可图的突破口。 他指出:“聊天模型输出虚假信息,只是品牌声誉问题;而拥有工具调用权限的 AI 智能体,若被误导做出错误操作,将会引发严重的安全隐患。”攻击者只需对智能体检索的信息来源进行投毒,就能操控智能体执行指定恶意行为。 斯托纳在博客中总结:“这次攻击测试,我只花了 12 美元注册域名、编辑了一条维基百科词条,耗时不过二十分钟。试想,若有蓄意攻击者批量注册虚假域名、在数十个低流量维基百科词条中同步植入虚假内容,攻击面会瞬间急剧扩大。” 斯托纳认为,大语言模型服务商必须正视检索投毒问题,并向用户作出风险提示。他预计,未来 AI 聊天机器人很快会新增风险警示功能,尤其针对检索增强生成的内容。 他还呼吁 AI 企业将数据溯源纳入核心研发环节,同时对近期新增的网络内容进行启发式筛查,识别可疑特征。以本次纸牌游戏造假事件为例:单一引文指向维基百科更新前后短期内刚注册的域名,本应触发风险预警,却被 AI 完全忽略。 如今这场虚假赛事已被从维基百科删除,AI 检索增强生成结果中也不再出现相关内容。但斯托纳强调,此次骗局利用的信任逻辑漏洞真实存在,已然成为人工智能行业亟待解决的潜在隐患。 斯托纳表示:“很高兴我的文章能引发业界对大语言模型、信息来源、信息可信度以及底层运行逻辑的讨论。这正是我做这次实验的初衷,而目前看来,我的目标已经达成。”

www.ithome.com · 2026-05-04 06:53:33+08:00 · tech

IT之家 5 月 4 日消息,曾用名爱问吉夫斯(Ask Jeeves)的搜索引擎与问答服务网站 Ask.com 现已正式关停。 据IT之家了解,爱问吉夫斯于 1996 年首次上线, 主打以自然语言解答日常口语化提问,堪称如今人工智能聊天机器人的前身雏形 。然而在其近 30 年的发展历程中,始终被其他搜索引擎产品、尤其是谷歌的光芒所掩盖。 控股公司 IAC 于 2005 年收购了爱问吉夫斯,随后很快去掉了名称中的“吉夫斯(Jeeves)”字样;到 2010 年,该平台缩减搜索引擎业务规模,重新聚焦问答服务。同年,IAC 集团董事长巴里・迪勒在 TechCrunch Disrupt 上表示, Ask.com 已无法与谷歌抗衡,且在 IAC 的股价估值中也不再具备价值。 目前 Ask.com 官网发布公告称:“随着 IAC 持续精简业务、聚焦核心发展,我们决定终止旗下包括 Ask.com 在内的搜索业务。历经 25 年为全球用户答疑解惑, Ask.com 已于 2026 年 5 月 1 日正式关停。” 尽管网站已经停运,但其官网仍强调:吉夫斯的精神永不落幕。

www.ithome.com · 2026-05-02 09:12:50+08:00 · tech

IT之家 5 月 2 日消息,据“国家广播电视总局”公众号消息,国家广播电视总局 4 月 29 日召开集中治理电视剧侵权传播动员会。 会议指出,电视剧(网络剧)侵权传播严重损害制片方、播出方合法权益,破坏广电视听行业健康可持续发展。广电总局立足行业管理职责,会同国家版权局等相关监管部门,压实网络平台主体责任, 重点治理非法网站和浏览器、搜索引擎、网盘的电视剧侵权传播问题 。 会议强调,要坚持标本兼治、综合施治、防治并举,集中治理与常态化落实相结合,做好电视剧侵权传播治理工作与国家版权局“剑网 2026”专项行动的有效衔接,加强广电视听媒体宣传,在全社会普及版权知识,提升版权保护意识。 各平台迅速启动电视剧侵权盗版治理工作,IT之家附 5 月 1 日各平台处置情况如下: 百度搜索:处理版权投诉链接 41337 条。 百度网盘:处理版权投诉链接 3152 条。 360:主动设置敏感词策略 11 条,受理侵权邮件 225 封,删除侵权链接 28513 条。 UC、夸克:全面排查搜索结果、网盘中的侵权影视剧内容,举一反三管控,新增关键词 31 个,清理盗版链接 140 条;新增拦截分享链接数 6366 条,新增拦截分享文件 171892 个。 QQ 浏览器:根据重点作品预警名单以及权利方投诉,共处置侵权盗版链接 239 条。 悟空浏览器:举一反三添加搜索屏蔽词 735 组,拉黑侵权盗版链接 5414 条,添加搜索推荐屏蔽词 140 组。 抖音:清理侵权盗版短视频 531 条。 快手:已在规定时间内对权利人的投诉采取处置措施,并主动对长切条剧集内容和违规直播进行自查治理,共下线违规视频 273 条。 B 站:拦截、清理、下线侵权盗版视频量 178 条。

www.ithome.com · 2026-04-16 18:04:46+08:00 · tech

IT之家 4 月 16 日消息,欧盟委员会已向谷歌发送初步调查结果,列明了为遵守《数字市场法案》(DMA)而拟采取的措施。根据这些拟议措施,谷歌应允许第三方搜索引擎以公平、合理且非歧视的条款获取搜索数据,包括排名、查询、点击和浏览数据。 这些措施旨在让第三方在线搜索引擎(即“数据受益方”)优化其搜索服务,并与谷歌搜索展开竞争。 IT之家注意到,拟议措施涵盖以下内容: 可获取搜索数据的受益方资格,包括具备搜索功能的人工智能(AI)聊天机器人; 谷歌必须共享的搜索数据范围; 谷歌共享搜索数据的方式与频率; 确保个人数据匿名化的措施; 为搜索数据设定公平、合理、非歧视价格的参数; 规范受益方获取搜索数据的流程。 为确保这些拟议措施切实有效,欧盟委员会邀请相关方通过公开咨询对其发表意见。