搜索引擎 - WWW.KEGFUUK.CN

www.ithome.com · 2026-05-06 17:14:40+08:00 · tech

IT之家 5 月 6 日消息，据路透社报道，当地时间周二，谷歌杰出科学家谢尔盖 · 瓦西尔维茨基向欧盟反垄断监管机构发出警告，如果欧盟要求谷歌向 OpenAI 等竞争对手开放搜索引擎数据，用户隐私可能面临暴露风险。这是谷歌围绕搜索业务监管争议作出的迄今最强硬回应之一。近几年，欧盟委员会通过多项法规加强对大型科技公司的监管，希望给用户更多选择，也让中小竞争对手获得更多竞争空间。不过，相关监管举措也引发美国政府不满。瓦西尔维茨基自 2012 年起担任谷歌杰出科学家，被视为有关领域的领军人物。他将于周三会见欧盟反垄断官员，说明谷歌的担忧，并提出一套范围更广、保护措施更完善的替代方案。一个月前，欧盟委员会曾列出一系列要求，要求谷歌以公平、合理、非歧视性条件，让竞争搜索引擎访问搜索数据，包括排名、查询、点击和浏览数据。这项欧盟提议将在未来几周根据相关方反馈最终确定。谷歌对此强烈反对，称此举系“监管越界”，可能危及用户隐私和安全。瓦西尔维茨基表示，关键问题在于欧盟委员会提出的个人数据匿名化方法。谷歌担心，这套方法不足以防止现代 AI 工具从数据中重新识别用户身份。“我们感到担忧，因为欧盟委员会的匿名化方法无法保护欧洲人的隐私：我们的红队在不到两个小时内就成功重新识别了用户。” IT之家注：谷歌 AI 红队由一组黑客组成，负责模拟多种现实攻击场景，找出潜在漏洞和弱点，并提出修复方案。瓦西尔维茨基表示：“我们希望分享自身技术专业知识，并与欧盟委员会合作，建立正确的保护措施，保护欧洲人免受隐私伤害。” 欧盟监管机构将在 7 月 27 日前决定谷歌必须落实的具体措施。如果谷歌未能执行，可能会被认定违反《数字市场法》。这部法律旨在限制大型科技公司的权力，违规罚款最高可达谷歌全球年收入的 10%。相关阅读：《欧盟委员会：谷歌应允许第三方搜索引擎获取搜索数据》

仅花 12 美元，工程师成功欺骗 AI 将虚构赛事奉为事实

www.ithome.com · 2026-05-04 11:20:10+08:00 · tech

IT之家 5 月 4 日消息，普通搜索引擎会让用户自行甄别信息来源的可信度，而依托搜索能力的人工智能聊天机器人，却能把漏洞百出的网络素材包装成笃定确凿的答案。据 The Register 报道，就有这样一个典型案例：一名安全工程师哄骗多款 AI 机器人，声称自己是德国一款热门纸牌游戏的现任世界冠军，可事实上这项赛事根本不存在。直到近期，维基百科的《谁是牛头王》（6 Nimmt!，英语地区玩家也称“拿五分”）词条里，还赫然标注着罗恩・斯托纳是 2025 年该项赛事的世界冠军。该维基百科条目引用了看起来十分官方的 6nimmt.com 网站作为依据，点开这个网址，确实能看到一篇简短的新闻通稿，宣称斯托纳斩获冠军。整件事的破绽显而易见：斯托纳本人承认，维基百科的夺冠词条、以及留存这份唯一“夺冠证据”的 6nimmt.com 域名，都是他一手伪造的。可即便如此，当他向多款 AI 聊天机器人询问此事时，机器人依旧笃定地称他为世界冠军。斯托纳在博客文章中表示：“我的网站没有任何独立第三方佐证，完全是凭空捏造。整个虚假骗局，仅仅建立在我喝咖啡时花 12 美元（IT之家注：现汇率约合 82 元人民币）注册的一个域名之上。” 换言之，这是检索增强生成（RAG）层面的信息投毒。它不属于提示词注入攻击，却直击人工智能联网搜索这一核心功能漏洞。正如斯托纳所解释的：AI 并不会真正在意其引用的权威信息来源出处，而这正是斯托纳设计本次实验想要利用的关键点。斯托纳写道：“所有具备联网搜索能力的前沿大语言模型，都会依据检索排名最高的内容生成答案。”在这场本就不存在的《谁是牛头王》赛事骗局中，他刻意植入的虚假来源是全网唯一相关信息，再加上维基百科自带的权威背书，轻易就能误导 AI 把谎言当成事实。这种造假手法门槛极低，即便不懂技术的普通人也能轻松复刻。斯托纳称：“我这次的操作并无新意，不过是把传统搜索引擎优化和虚假信息传播手段，套上了大语言模型的新技术外壳与交互界面。真正的变化在于，如今 AI 会把这类虚假结果包装成权威信息呈现给用户，而绝大多数用户根本不了解背后的数据流转逻辑。” 斯托纳在分析文章中指出：“大语言模型最不擅长识别的，恰恰是它的核心设计逻辑 —— 无条件信任文本和网络资源。别指望模型能自行分辨真伪，它根本分不清某个信息来源是真实权威网站，还是我上周二刚注册的空壳域名；就连‘strawberry（草莓）’这个单词里到底有几个字母 R，它都没法精准判断。” 他解释道，本次实验暴露的漏洞包含三类失效模式，若被别有用心之人利用，造成的危害远比捏造一场纸牌游戏赛事严重得多。第一，检索层漏洞。只要大语言模型依托网络搜索作答，就会直接沿用检索结果排名内容的可信度，极易输出错误信息。第二，模型训练语料漏洞。斯托纳表示，若维基百科的虚假词条留存时间足够长、被网络爬虫抓取收录，就会混入 AI 训练语料库。他于 2025 年 2 月添加了虚假词条，直到上周五发布实验文章后才被删除。这意味着在此期间抓取维基百科数据的所有 AI 企业，都有可能把他虚构的夺冠经历纳入训练数据。斯托纳称：“即便维基百科后续撤销了虚假编辑，那些用撤销前数据训练的模型，依然会保留这份虚假信息。截至 2026 年，语料投毒的后续清理问题至今没有可行的解决方案。” 他计划半年左右待新一代 AI 模型发布后再次测试：若模型无需联网，就能默认他是赛事冠军，就足以证明这份谎言已经固化进了模型训练数据。第三，智能体漏洞。在斯托纳看来，这一漏洞才是恶意攻击者最有利可图的突破口。他指出：“聊天模型输出虚假信息，只是品牌声誉问题；而拥有工具调用权限的 AI 智能体，若被误导做出错误操作，将会引发严重的安全隐患。”攻击者只需对智能体检索的信息来源进行投毒，就能操控智能体执行指定恶意行为。斯托纳在博客中总结：“这次攻击测试，我只花了 12 美元注册域名、编辑了一条维基百科词条，耗时不过二十分钟。试想，若有蓄意攻击者批量注册虚假域名、在数十个低流量维基百科词条中同步植入虚假内容，攻击面会瞬间急剧扩大。” 斯托纳认为，大语言模型服务商必须正视检索投毒问题，并向用户作出风险提示。他预计，未来 AI 聊天机器人很快会新增风险警示功能，尤其针对检索增强生成的内容。他还呼吁 AI 企业将数据溯源纳入核心研发环节，同时对近期新增的网络内容进行启发式筛查，识别可疑特征。以本次纸牌游戏造假事件为例：单一引文指向维基百科更新前后短期内刚注册的域名，本应触发风险预警，却被 AI 完全忽略。如今这场虚假赛事已被从维基百科删除，AI 检索增强生成结果中也不再出现相关内容。但斯托纳强调，此次骗局利用的信任逻辑漏洞真实存在，已然成为人工智能行业亟待解决的潜在隐患。斯托纳表示：“很高兴我的文章能引发业界对大语言模型、信息来源、信息可信度以及底层运行逻辑的讨论。这正是我做这次实验的初衷，而目前看来，我的目标已经达成。”

运营三十年，老牌问答搜索引擎 Ask.com 停止运营

www.ithome.com · 2026-05-04 06:53:33+08:00 · tech

IT之家 5 月 4 日消息，曾用名爱问吉夫斯（Ask Jeeves）的搜索引擎与问答服务网站 Ask.com 现已正式关停。据IT之家了解，爱问吉夫斯于 1996 年首次上线，主打以自然语言解答日常口语化提问，堪称如今人工智能聊天机器人的前身雏形。然而在其近 30 年的发展历程中，始终被其他搜索引擎产品、尤其是谷歌的光芒所掩盖。控股公司 IAC 于 2005 年收购了爱问吉夫斯，随后很快去掉了名称中的“吉夫斯（Jeeves）”字样；到 2010 年，该平台缩减搜索引擎业务规模，重新聚焦问答服务。同年，IAC 集团董事长巴里・迪勒在 TechCrunch Disrupt 上表示， Ask.com 已无法与谷歌抗衡，且在 IAC 的股价估值中也不再具备价值。目前 Ask.com 官网发布公告称：“随着 IAC 持续精简业务、聚焦核心发展，我们决定终止旗下包括 Ask.com 在内的搜索业务。历经 25 年为全球用户答疑解惑， Ask.com 已于 2026 年 5 月 1 日正式关停。” 尽管网站已经停运，但其官网仍强调：吉夫斯的精神永不落幕。

国家广播电视总局：重点治理非法网站和浏览器、搜索引擎、网盘的电视剧侵权传播问题

www.ithome.com · 2026-05-02 09:12:50+08:00 · tech

IT之家 5 月 2 日消息，据“国家广播电视总局”公众号消息，国家广播电视总局 4 月 29 日召开集中治理电视剧侵权传播动员会。会议指出，电视剧（网络剧）侵权传播严重损害制片方、播出方合法权益，破坏广电视听行业健康可持续发展。广电总局立足行业管理职责，会同国家版权局等相关监管部门，压实网络平台主体责任，重点治理非法网站和浏览器、搜索引擎、网盘的电视剧侵权传播问题。会议强调，要坚持标本兼治、综合施治、防治并举，集中治理与常态化落实相结合，做好电视剧侵权传播治理工作与国家版权局“剑网 2026”专项行动的有效衔接，加强广电视听媒体宣传，在全社会普及版权知识，提升版权保护意识。各平台迅速启动电视剧侵权盗版治理工作，IT之家附 5 月 1 日各平台处置情况如下：百度搜索：处理版权投诉链接 41337 条。百度网盘：处理版权投诉链接 3152 条。 360：主动设置敏感词策略 11 条，受理侵权邮件 225 封，删除侵权链接 28513 条。 UC、夸克：全面排查搜索结果、网盘中的侵权影视剧内容，举一反三管控，新增关键词 31 个，清理盗版链接 140 条；新增拦截分享链接数 6366 条，新增拦截分享文件 171892 个。 QQ 浏览器：根据重点作品预警名单以及权利方投诉，共处置侵权盗版链接 239 条。悟空浏览器：举一反三添加搜索屏蔽词 735 组，拉黑侵权盗版链接 5414 条，添加搜索推荐屏蔽词 140 组。抖音：清理侵权盗版短视频 531 条。快手：已在规定时间内对权利人的投诉采取处置措施，并主动对长切条剧集内容和违规直播进行自查治理，共下线违规视频 273 条。 B 站：拦截、清理、下线侵权盗版视频量 178 条。

欧盟委员会：谷歌应允许第三方搜索引擎获取搜索数据

www.ithome.com · 2026-04-16 18:04:46+08:00 · tech

IT之家 4 月 16 日消息，欧盟委员会已向谷歌发送初步调查结果，列明了为遵守《数字市场法案》（DMA）而拟采取的措施。根据这些拟议措施，谷歌应允许第三方搜索引擎以公平、合理且非歧视的条款获取搜索数据，包括排名、查询、点击和浏览数据。这些措施旨在让第三方在线搜索引擎（即“数据受益方”）优化其搜索服务，并与谷歌搜索展开竞争。 IT之家注意到，拟议措施涵盖以下内容：可获取搜索数据的受益方资格，包括具备搜索功能的人工智能（AI）聊天机器人；谷歌必须共享的搜索数据范围；谷歌共享搜索数据的方式与频率；确保个人数据匿名化的措施；为搜索数据设定公平、合理、非歧视价格的参数；规范受益方获取搜索数据的流程。为确保这些拟议措施切实有效，欧盟委员会邀请相关方通过公开咨询对其发表意见。

/tag/搜索引擎