又来一个害人的悟空蜘蛛:WukongSpider

来自Jamesqi
跳转至: 导航搜索

--James Qi 2010年3月13日 (六) 11:36 (CST)

  上周我们有一台服务器的负载特别高,无论白天黑夜都是超负荷,导致监控的程序总是报警、重启Apache的程序也是反复工作,而服务器上网站的流量并没有特别增加。

  先是怀疑邮编库中添加了大量数据造成的,但数据库服务器一直很稳定,只是Apache服务器负载过高。今天周末看到负载依然很高,不得不又去下载Squid的日志查看,发现有一个以前没有出现过的WukongSpider出现频率过高,都超过Google / Baidu / Yahoo / Youdao / Soso等正规搜索引擎的抓取条数了。

  网上查了一下这个站:

唔箜搜索
唔箜搜索是综合型的手机搜索引擎,提供分类定向搜索,共有手机图片、手机铃声、mp3、手机地图、手机游戏等17个类别的搜索和下载.
wukong.net

  从界面上看是个手机浏览网站,Alexa排名在30多万位,但不知道手机终端浏览者是否多。

  将其IP地址220.181.122.70加入Squid的黑名单,重启Squid服务器后,后端的Apache服务器负载马上开始下降,现在设置过去1小时了,负载大约是以前的1/3。

  终于把这个害人的蜘蛛精Wukong Spider找出来、灭掉了,这个悟空搜索不知道是技术上有问题还是爬行的思路上出了问题,反正不能让它继续折腾我们服务器了,不知道它是否还在折腾别人网站的服务器。

标签:蜘蛛
相关内容:
  1. 2009-09-07 22:09:20 腾讯搜搜独立了,网站解除对Sosospider屏蔽
  2. 2008-11-22 18:36:07 给有道管理员的信(蜘蛛频率问题)
  3. 2008-11-11 10:36:54 为雅虎蜘蛛设置抓取频率限制
  4. 2008-11-10 11:14:55 给搜搜蜘蛛(Sosospider)的信(请勿骚扰)
  5. 2008-10-29 00:07:51 在Squid设置中多管齐下防止蜘蛛频繁抓取
  6. 2008-10-27 22:01:03 常见搜索引擎蜘蛛(爬虫、机器人)IP地址段

关于“又来一个害人的悟空蜘蛛:WukongSpider”的留言:

目前暂无留言

新增相关留言