`
webfootman
  • 浏览: 14206 次
社区版块
存档分类
最新评论

如何识别搜索引擎蜘蛛IP

 
阅读更多

做网站的人经常会发现一些IP过于频繁访问你的服务器,或者连接数太多!直接封了话,不知是恶意CC还是搜索引擎的蜘蛛!百度站长平台给出识别方法!菜鸟不放看看!老鸟可走开!^_^

如何识别Baiduspider2014-04-28

 

上周百度站长平台接到某站长求助,表示误封禁了Baiduspider的IP,询问是否有办法获得Baiduspider的所有IP,打算放入白名单加以保护,防止再次误封。在此要告诉各位站长,Baiduspider的IP池是不断变动的,我们无法提供IP全集。

除此之外,之前还有站长发来质疑说Baiduspider光顾过于频繁,已超越服务器承受能力。而百度站长平台追查发现,Baiduspider对该站点的抓取并无异常,那只spider极有可能是个李鬼。

那么,站长该如何通过IP来判断此spider是不是来自百度搜索引擎的呢?

可以通过DNS反查方式来解决这个问题。根据平台不同验证方法不同,如linux/windows/os三种平台下的验证方法分别如下:

1、在linux平台下,您可以使用host ip命令反解ip来判断是否来自Baiduspider的抓取。Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。



 2、windows平台或者IBM OS/2平台下,您可以使用nslookup ip命令反解ip 判断是否来自Baiduspider的抓取。打开命令处理器 输入nslookup xxx.xxx.xxx.xxxIP 址)就能解析ip 来判断是否来自Baiduspider的抓取,Baiduspiderhostname*.baidu.com *.baidu.jp 的格式命名,非 *.baidu.com  *.baidu.jp 即为冒充。

3、在mac os平台下,您可以使用dig 命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 输入dig xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或*.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。

 

看到这,看有一个很明显的IP段很多IP在访问我的网站,随便用上述方法测试了下,发现IP是google的,呵呵!看来方法很实用!

  • 大小: 82.7 KB
分享到:
评论

相关推荐

    余志国搜索引擎蜘蛛来访记录系统asp版v2.0

    该程序采用ASP编写,使用Access数据库,主要功能是记录常用搜索引擎蜘蛛最近来访时间、IP、来访次数、抓取页面地址。 经过2周的亲自测试,截至2009.8.30,本系统可统计95种蜘蛛。由于搜索引擎抓取网页不抓取JS代码,...

    最全的搜索引擎蜘蛛IP地址

    最新最全的google、百度、163,、msn 、QQ、sina 等等搜索引擎蜘蛛IP地址

    搜索引擎蜘蛛捕捉php版

    搜索引擎派出“蜘蛛”程序检索现有网站一定IP地址范围内的新网站,而对现有网站的更新则根据该网站的等级不同有快慢之分。一般来说,网站网页等级越高,更新的频率就越快。搜索引擎的“蜘蛛”同一天会对某些网站或...

    余志国搜索引擎蜘蛛来访记录系统 v2.0.rar

    该程序采用ASP编写,使用Access数据库,主要功能是记录常用搜索引擎蜘蛛最近来访时间、IP、来访次数、抓取页面地址。 经过2周的亲自测试,截至2009.8.30,本系统可统计95种蜘蛛。由于搜索引擎抓取网页不抓取JS代码...

    搜索引擎蜘蛛ip打包包含:360,bing,百度,谷歌,神马,搜狗,头条,网站白名单ip

    搜索引擎蜘蛛ip打包包含:360,bing,百度,谷歌,神马,搜狗,头条,网站白名单ip

    搜素引擎蜘蛛IP.xlsx

    搜素引擎蜘蛛IP.xlsx

    58天搜索引擎蜘蛛爬行记录插件v1.0

    8天搜索引擎蜘蛛爬行访问记录日志插件,是一款可以实时监控搜索引擎蜘蛛爬行的网站系统...具备大量蜘蛛标识数据库,可识别目前常见的搜索引擎蜘蛛ID。程序具备支持搜索蜘蛛中文名、蜘蛛标识ID、蜘蛛来路IP地址功能。

    搜索引擎蜘蛛捕捉测试正常版本

    蜘蛛爬行报告提供蜘蛛的以下数据:来访时间、蜘蛛类型、来访IP等众多信息。当然蜘蛛也会有好坏之分,如Google,Baidu等蜘蛛当然...不同的搜索引擎派出“蜘蜘”的周期也不一样!你想详细知道它们的足迹吗?赶快来试试吧!

    余志国搜索引擎蜘蛛来访记录系统 2.0.rar

    该程序采用ASP编写,使用Access数据库,主要功能是记录常用搜索引擎蜘蛛最近来访时间、IP、来访次数、抓取页面地址。 经过2周的亲自测试,截至2009.8.30,本系统可统计95种蜘蛛。由于搜索引擎抓取网页不抓取JS代码...

    百度、google等搜索引擎蜘蛛监控

    5、日志分析,详细记录每个蜘蛛访问某网页的具体信息,方便统计每个蜘蛛每天来访次数,并能批量提取每个蜘蛛的来访IP; 6、每次修改后,您无需重启IIS,直接应用即可加载新的设置。 二、基本介绍: 发布版本:...

    站长专用IIS日志蜘蛛IP标记JS脚本

    搜集了网友提供的各种搜索引擎蜘蛛IP段,配合html网页使用,请以JS调用的形式放置在源代码的</body></html>之间,然后利用Fontpage、Dreamweaver或者KompoZer之类的工具,在常规编辑模式下将IIS日志内容...

    织梦网站蜘蛛爬行痕迹记录插件-支持各类搜索引擎

    织梦网站蜘蛛爬行痕迹记录插件最新版,此款插件支持各类搜索引擎及织梦静态动态伪静态,插件功能齐全,可查看到蜘蛛爬行记录,支持删除。 1、无需利用三方工具查看爬行记录,方便快捷省事。 2、插件安装简单快捷,...

    PHP搜索引擎蜘蛛爬行日志分析器

    内容索引:PHP源码,查询搜索,搜索引擎,SEO 卡卡家园的搜索引擎蜘蛛爬行日志查看分析工具,基于PHP环境,因为大家都知道ASP的IIS自带有分析器,很方便,因此这个程序主要针对PHP,有了它你可以跟踪你网站每天搜索引擎...

    蜘蛛ip总结

    蜘蛛是搜索引擎获得页面内容的一个重要的途径,通过蜘蛛的抓取可以得到一个页面的最主要的内容从而收录百度数据库系统,每次抓取之后都会再与数据库原有的信息进行比对,来确定页面的总体质量。

    wordpress SEO蜘蛛访问统计插件 v1.0

    对于站长来说查看搜索引擎蜘蛛抓取的频率了解蜘蛛抓取的深度,能够快速了解搜索引擎抓取问题,从而更快的优化网站,而对于站长来说每天去查看网站日志肯定会很麻烦,所以这款wordpress插件就能解决wordpress站长优化...

    TK日志精灵 - 一款用于windows服务器环境下iis网站日志蜘蛛分析小工具

    适用于windows7及以上x64版本系统,支持批量对日志文件进行解读并对各类搜索引擎访问记录、...通过工具可以大致了解蜘蛛对网站的基本页面爬取,搜索引擎蜘蛛爬取页面是否状态异常等情况 同类软件可参考在线工具loghao,

    wordpress SEO蜘蛛访问统计插件.zip

    对于站长来说查看搜索引擎蜘蛛抓取的频率了解蜘蛛抓取的深度,能够快速了解搜索引擎抓取问题,从而更快的优化网站,而对于站长来说每天去查看网站日志肯定会很麻烦,所以这款wordpress插件就能解决wordpress站长优化...

    E桶金行业搜索引擎系统(包含多线程客户端蜘蛛系统) V1.6.rar

    E桶金行业搜索引擎系统(包含多线程客户端蜘蛛系统) V1.6 版发布! E桶金行业搜索引擎 特别适用于超大、中型信息门户、行业门户、电子商务等网站使用。 它是一款真正意义上的搜索引擎:具有自己的蜘蛛、分词、索引...

    E桶金聚合搜索引擎 v4.0.rar

    3.增加聚合搜索日志的IP黑名单功能,轻松将一些不知名蜘蛛的ip加入黑名单,避免搜索日志迅速变大影响性能。 4.前台搜索界面仿百度的最新风格,更加简洁、实用。(重要) 5.对用户中心和用户注册登录界面全新改版,...

    搜索引擎代码

    E桶金行业搜索引擎系统(包含多线程客户端蜘蛛系统) V1.6 版发布! E桶金行业搜索引擎 特别适用于超大、中型信息门户、行业门户、电子商务等网站使用。 它是一款真正意义上的搜索引擎:具有自己的蜘蛛、分词、索引...

Global site tag (gtag.js) - Google Analytics