google蜘蛛的ip段有哪些呢?
您可以验证存取伺服器的网路检索器是否确实为Google 检索器(例如Googlebot)。如果担心垃圾邮件制造者或其他恶意份子假冒Googlebot 存取您的网站,这是相当实用的解决方法。
Google 检索器分为三类:
| 类型 | 说明 | 反向DNS 遮盖 | IP 范围 |
|---|---|---|---|
| 常见检索器 | Google 产品使用的常见检索器(例如Googlebot)。这类检索器一律会遵循自动检索的robots.txt 规则。 | crawl-***-***-***-***.googlebot.com或geo-crawl-***-***-***-***.geo.googlebot.com | googlebot.json |
| 特殊情况检索器 | 会针对Google 产品(例如AdsBot) 执行特定函式的检索器,接受检索的网站和产品之间,有针对检索程序制定的协议。这类检索器不一定会遵循robots.txt 规则。 | rate-limited-proxy-***-***-***-***.google.com | special-crawlers.json |
| 使用者触发的撷取程式 | 由使用者触发撷取动作的工具和产品函式。举例来说,Google 网站验证工具就是依据使用者的要求而行动。由于撷取动作是由使用者提出要求,因此撷取程式会忽略robots.txt 规则。 Google 控管的撷取器是源自物件中的IP,且会解析为主机名称。物件中的IP 会解析为主机名称。举例来说,在Google Cloud (GCP) 上执行的网站,其功能需要依据该网站的使用者要求撷取外部RSS 动态消息,就会使用这些IP。 user-triggered-fetchers-google.jsongoogle.comuser-triggered-fetchers.jsongae.googleusercontent.com | ***-***-***-***.gae.googleusercontent.com或google-proxy-***-***-***-***.google.com | user-triggered-fetchers.json和user-triggered-fetchers-google.json |
验证Google 检索器的方式有两种:
手动:适用于一次性查询,会使用指令列工具。在大多数情况下,这个方法就够用了。
自动:适用于大规模查询,会使用自动解决方案来比对检索器的IP 位址,检查是否符合已发布的Googlebot IP 位址清单。
使用指令列工具
找出记录中存取伺服器的IP 位址,使用
host指令执行反向DNS 查询。确认网域名称是否为
googlebot.com、google.com或googleusercontent.com。针对您在步骤1 撷取到的网域名称,使用
host指令执行正向DNS 查询。确认查询结果是否为本来记录中存取伺服器的IP 位址。
范例1:
host 66.249.66.11.66.249.66.in-addr.arpa domain name pointer crawl-66-249-66-1.googlebot.com.host crawl-66-249-66-1.googlebot.comcrawl-66-249-66-1.googlebot.com has address 66.249.66.1
范例2:
host 35.247.243.240240.243.247.35.in-addr.arpa domain name pointer geo-crawl-35-247-243-240.geo.googlebot.com.host geo-crawl-35-247-243-240.geo.googlebot.comgeo-crawl-35-247-243-240.geo.googlebot.com has address 35.247.243.240
范例3:
host 66.249.90.7777.90.249.66.in-addr.arpa domain name pointer rate-limited-proxy-66-249-90-77.google.com.host rate-limited-proxy-66-249-90-77.google.comrate-limited-proxy-66-249-90-77.google.com has address 66.249.90.77
使用自动解决方案
或者,您也可以比对检索器的IP 位址和Google 检索器与撷取程式的IP 范围,依照IP 位址来辨别是否真的是Googlebot。
针对其他可能存取网站的Google IP 位址(例如来自Apps Script ),请将进行存取的IP 位址与一般Google IP 位址清单进行比对。请注意,JSON 档案中的IP 位址会以CIDR 格式表示。
这对你有帮助吗?
https://www.gstatic.com/ipranges/goog.json