google蜘蛛的ip段有哪些呢?

您可以验证存取伺服器的网路检索器是否确实为Google 检索器(例如Googlebot)。如果担心垃圾邮件制造者或其他恶意份子假冒Googlebot 存取您的网站,这是相当实用的解决方法。

Google 检索器分为三类:

类型说明反向DNS 遮盖IP 范围
常见检索器Google 产品使用的常见检索器(例如Googlebot)。这类检索器一律会遵循自动检索的robots.txt 规则。crawl-***-***-***-***.googlebot.comgeo-crawl-***-***-***-***.geo.googlebot.comgooglebot.json
特殊情况检索器会针对Google 产品(例如AdsBot) 执行特定函式的检索器,接受检索的网站和产品之间,有针对检索程序制定的协议。这类检索器不一定会遵循robots.txt 规则。rate-limited-proxy-***-***-***-***.google.comspecial-crawlers.json
使用者触发的撷取程式由使用者触发撷取动作的工具和产品函式。举例来说,Google 网站验证工具就是依据使用者的要求而行动。由于撷取动作是由使用者提出要求,因此撷取程式会忽略robots.txt 规则。
Google 控管的撷取器是源自物件中的IP,且会解析为主机名称。物件中的IP 会解析为主机名称。举例来说,在Google Cloud (GCP) 上执行的网站,其功能需要依据该网站的使用者要求撷取外部RSS 动态消息,就会使用这些IP。user-triggered-fetchers-google.jsongoogle.comuser-triggered-fetchers.jsongae.googleusercontent.com
***-***-***-***.gae.googleusercontent.comgoogle-proxy-***-***-***-***.google.comuser-triggered-fetchers.jsonuser-triggered-fetchers-google.json

验证Google 检索器的方式有两种:

  • 手动:适用于一次性查询,会使用指令列工具。在大多数情况下,这个方法就够用了。

  • 自动:适用于大规模查询,会使用自动解决方案来比对检索器的IP 位址,检查是否符合已发布的Googlebot IP 位址清单。

使用指令列工具

  1. 找出记录中存取伺服器的IP 位址,使用host指令执行反向DNS 查询。

  2. 确认网域名称是否为googlebot.comgoogle.comgoogleusercontent.com

  3. 针对您在步骤1 撷取到的网域名称,使用host指令执行正向DNS 查询。

  4. 确认查询结果是否为本来记录中存取伺服器的IP 位址。

范例1:

host 66.249.66.11.66.249.66.in-addr.arpa domain name pointer crawl-66-249-66-1.googlebot.com.host crawl-66-249-66-1.googlebot.comcrawl-66-249-66-1.googlebot.com has address 66.249.66.1

范例2:

host 35.247.243.240240.243.247.35.in-addr.arpa domain name pointer geo-crawl-35-247-243-240.geo.googlebot.com.host geo-crawl-35-247-243-240.geo.googlebot.comgeo-crawl-35-247-243-240.geo.googlebot.com has address 35.247.243.240

范例3:

host 66.249.90.7777.90.249.66.in-addr.arpa domain name pointer rate-limited-proxy-66-249-90-77.google.com.host rate-limited-proxy-66-249-90-77.google.comrate-limited-proxy-66-249-90-77.google.com has address 66.249.90.77

使用自动解决方案

或者,您也可以比对检索器的IP 位址和Google 检索器与撷取程式的IP 范围,依照IP 位址来辨别是否真的是Googlebot。

针对其他可能存取网站的Google IP 位址(例如来自Apps Script ),请将进行存取的IP 位址与一般Google IP 位址清单进行比对。请注意,JSON 档案中的IP 位址会以CIDR 格式表示。

这对你有帮助吗?

https://www.gstatic.com/ipranges/goog.json



标签: Google

添加新评论 »