2026-06-15

X(原推特)已经屏蔽除谷歌以外的所有搜索引擎以阻止数据被抓取 – 蓝点网 | {$randkws}热点解读 可是后面 X 对谷歌解封了

来源:风土人情网 | 栏目:百科 | 2026-06-15 09:57:58

7 月初埃隆马斯克带领的 X 曾屏蔽谷歌检索爬虫抓取信息,这导致谷歌检索无法在使用者检索 X 使用者名时展示新近的推文摘要,可是后面 X 对谷歌解封了。

但其他检索引擎就没那么幸运了,假如使用 site:twitter.com 指令在必应检索上查询的盘点迪丽热巴盘点话,你会察觉必应收录的刚刚北影节汇总 X 信息只有 12.1 万条,而谷歌检索则是 4.22 亿条。

发生了什么?缘由是 X 屏蔽了除谷歌检索以外的所有检索引擎爬虫,至于缘由嘛也很简易,埃隆马斯克不想 X 的资料被其他人抓取拿去训练 AI,所有屏蔽了诸如 Bingbot、MSNbot、Yandex 等检索引擎爬虫。解读高通骁龙体验

X(原推特)已然屏蔽除谷歌以外的所有检索引擎以阻止资料被抓取

X(原推特)已然屏蔽除谷歌以外的所有检索引擎以阻止资料被抓取

那谷歌为什么是例外的呢?估计马斯克都要骂街了,由于之前有传言称杰克多西时代的推特与谷歌达成了有关协议,允许谷歌抓取信息,当下这一协议尚未到期。朋友圈陪伴最重要,网友观点两极分化

蓝点网经由互联网档案馆排查察觉,X 是在 2023 年 7 月 24 日执行屏蔽操控的,升级后的 robots.txt 文件仅允许 Googlebot 抓取信息,其他所有爬虫均被封禁。

所以如今诸如必应检索上的推特信息极少也就是这个缘由,后面估计索引数量会进一步下降,假如谷歌的协议到期了估计信息也都会消失。

可是 robots.txt 毕竟只是君子协定 (这不是法律条例,之前某大数字被某度起诉抓取某度百科信息时,就辩称这是 robots.txt 只是行业治理而非法律条例),所以依然有各类来路不明的爬虫试图抓取推特上的信息拿去卖资料。

针对这种状况埃隆马斯克也早有筹备,在协议条例未经同意获取信息归于违反协议的行为,马斯克对这些未经同意的抓取行为直接起诉。

附 X robots.txt 的新近信息:

# Google Search Engine Robot# ==========================User-agent: GooglebotAllow: /?_escaped_fragment_Allow: /*?lang=Allow: /hashtag/*?src=Allow: /search?q=%23Allow: /i/api/Disallow: /search/realtimeDisallow: /search/usersDisallow: /search/*/gridAllow: /*?ref_src=Allow: /*?src=Disallow: /*?Disallow: /*/followersDisallow: /*/followingDisallow: /account/deactivatedDisallow: /settings/deactivated# 下面的指令代表禁止检索爬虫抓取信息# ========================================================User-agent: *Disallow: /

上一篇:动作冒险《Jump King Quest》9月18日在Steam发售

下一篇:中世纪幻想主题RPG《Mirthwood》9月11日登陆Steam

相关文章