百度站长平台:如何识别Baiduspider

上周百度站长平台接到某站长求助,表示误封禁了Baiduspider的IP,询问是否有办法获得Baiduspider的所有IP,打算放入白名单加以保护,防止再次误封。在此要告诉各位站长,Baiduspider的IP池是不断变动的,我们无法提供IP全集。

除此之外,之前还有站长发来质疑说Baiduspider光顾过于频繁,已超越服务器承受能力。而百度站长平台追查发现,Baiduspider对该站点的抓取并无异常,那只spider极有可能是个李鬼。

那么,站长该如何通过IP来判断此spider是不是来自百度搜索引擎的呢?

可以通过DNS反查方式来解决这个问题。根据平台不同验证方法不同,如linux/windows/os三种平台下的验证方法分别如下:

1、在linux平台下

您可以使用host ip命令反解ip来判断是否来自Baiduspider的抓取。Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。

使用host ip命令反解ip来判断是否是百度蜘蛛

2、在windows平台或者IBM OS/2平台下

您可以使用nslookup ip命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 输入nslookup xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以*.baidu.com 或*.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。

如下图:通过NSLOOKUP这个命令反果IP地址时,如果出现“名称:baiduspider”字样的话,就是正真的百度蜘蛛了。(方法博客注)

使用nslookup ip命令反解ip来 判断是否来自Baiduspider的抓取

3、在mac os平台下

您可以使用dig 命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 输入dig xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或*.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。

文章来源:百度站长平台

方法博客提示:如何识别Baiduspider在SEO工作中有着非常重要的意义,比如在做日志分析时,会发现有很多人冒充Baiduspider来采集你的网站,而且这种日志量一般都非常大,这时候你如果不把这些假的Baiduspider过滤出来,就对会日志分析的结果造成比较大的偏差,至于怎么快速过滤出这些假的百度蜘蛛,方法博客曾经写过一篇文章详细的介绍过一种方法简单三步用shell拆分出真实百度蜘蛛ip来访日志,想学习更多更深入的SEO技巧的朋友们可以阅读下。

  • 版权声明:除非注明,本博客均为北京SEO方法的原创文章,转载或引用请以超链接形式标明本文地址,否则会在SEO圈内公开此种不尊重版权的行为,谢谢合作!本文地址:http://seofangfa.com/baidu-webmastertools/how-to-discriminate-baiduspider.html
    本文信息:于3年前,由方法SEO发表,共 1154字。

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: