- A+
上周百度站长平台接到某站长求助,表示误封禁了Baiduspider的IP,询问是否有办法获得Baiduspider的所有IP,打算放入白名单加以保护,防止再次误封。在此要告诉各位站长,Baiduspider的IP池是不断变动的,我们无法提供IP全集。
除此之外,之前还有站长发来质疑说Baiduspider光顾过于频繁,已超越服务器承受能力。而百度站长平台追查发现,Baiduspider对该站点的抓取并无异常,那只spider极有可能是个李鬼。
那么,站长该如何通过IP来判断此spider是不是来自百度搜索引擎的呢?
可以通过DNS反查方式来解决这个问题。根据平台不同验证方法不同,如linux/windows/os三种平台下的验证方法分别如下:
1、在linux平台下
您可以使用host ip命令反解ip来判断是否来自Baiduspider的抓取。Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。
2、在windows平台或者IBM OS/2平台下
您可以使用nslookup ip命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 输入nslookup xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以*.baidu.com 或*.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。
如下图:通过NSLOOKUP这个命令反果IP地址时,如果出现“名称:baiduspider”字样的话,就是正真的百度蜘蛛了。(方法博客注)
3、在mac os平台下
您可以使用dig 命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 输入dig xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或*.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。
文章来源:百度站长平台
方法博客提示:如何识别Baiduspider在SEO工作中有着非常重要的意义,比如在做日志分析时,会发现有很多人冒充Baiduspider来采集你的网站,而且这种日志量一般都非常大,这时候你如果不把这些假的Baiduspider过滤出来,就对会日志分析的结果造成比较大的偏差,至于怎么快速过滤出这些假的百度蜘蛛,方法博客曾经写过一篇文章详细的介绍过一种方法简单三步用shell拆分出真实百度蜘蛛ip来访日志,想学习更多更深入的SEO技巧的朋友们可以阅读下。