给搜搜蜘蛛(Sosospider)的信(请勿骚扰)

来自Jamesqi
跳转至: 导航搜索

--James Qi 2008年11月10日 (一) 11:14 (CST)

下面是按照http://help.soso.com/webspider.shtml 中的说明,发给 mailto:sosospider@tencent.com 的邮件:

给Sosospider的信

您好!

贵公司的Sosospider 查询页面速度过快,124.115.0.xxx,124.115.4.xxx,等IP多次让我们服务器负载过高。

我们用robots.txt拒绝了你们的收录,后来干脆在Squid服务器中设置了拒绝“deny”Sosospider,时间超过一年你们的蜘蛛还是依然如故不断来骚扰。

特来信请求,以后不要访问这些域名的网站:

  • 18dao.cn
  • 18dao.net
  • 18dao.org
  • 027.net
  • 027.cn

或者不要再访问 211.91.135.101 这个IP地址上的所有网站。

你们可以自己去谷歌上搜索 Sosospider这个关键词,排在前面的是如下内容:

  • soso网络蜘蛛(sosospider)导致服务器瘫痪的最终解决方案- 天狼工作室
  • Tommy 碎碎念: 另人厌恶的sosospider - 繁
  • 从Sosospider的疯狂抓取频率
  • 从昨天晚上开始基本上就无法打开网站了,该死的sosospider
  • 原来正是恶名昭彰的腾讯sosospider。 ...

请你们正视这些问题,尽快提高技术水平,谢谢。


James Qi

收到Sosospider的回信

站长: 您好!

对于spider抓取给贵网站造成的压力,我们深表歉意,并立刻请工程师对你陈述的进行了检查, 在分别对贵网站www子域的robot进行解析时,并未发现有禁止sosospider采集的标识,如果方便, 请您提供robots文件以便检查原因。

目前我们已经降低对贵网站的抓取频率,此外,降低速度的同时,可能也会影响页面进索引,从而 被用户检索到的速度,希望您能理解。

如果您还有其他的疑问,请随时与我们联系,我们会积极协助您解决。


2008-11-10

sosospider


再次去邮件补充一个域名

您好!

我们原来在robots.txt中设置了屏蔽Sosospider无效,后来就去掉了,改从Squid中拒绝访问。

谢谢你们配合降低了抓取速度,另外你们还有一个Sosoimagespider也请降低抓取速度。

除了上次说的几个域名以外,还有一个域名也请一并降低抓取速度:

  • 18dao.cn
  • 18dao.net
  • 18dao.org
  • 027.net
  • 027.cn
  • jamesqi.com (这次新增)

并请将这些域名的所有子域名都降低抓取速度。

你们网站的搜索结果完全是Google的内容,你们不是和谷歌合作用他们的搜索了吗?怎么还要继续抓取呢?

James Qi


后记:虽然Soso回信说已经降低了抓取速度,但我从日志中看还是有不少来自Soso的,并且几次负载高峰期发现依然是Soso的访问最多,真是精力过剩啊!只有还是屏蔽其IP了!

补充:2009年9月搜搜与谷歌合作到期后独立运行,我们随之解开了屏蔽的IP地址,也重新发邮件给Sosospider要求恢复对我们网站的正常爬行、收录。--James Qi 2009年9月13日 (日) 22:56 (CST)

标签:搜搜蜘蛛
相关内容:
  1. 2010-03-13 11:36:54 又来一个害人的悟空蜘蛛:WukongSpider
  2. 2009-10-20 11:15:22 搜搜Soso的搜索技术目前还真不行
  3. 2009-09-07 22:09:20 腾讯搜搜独立了,网站解除对Sosospider屏蔽
  4. 2008-11-22 18:36:07 给有道管理员的信(蜘蛛频率问题)
  5. 2008-11-11 10:36:54 为雅虎蜘蛛设置抓取频率限制
  6. 2008-10-29 00:07:51 在Squid设置中多管齐下防止蜘蛛频繁抓取
  7. 2008-10-27 22:01:03 常见搜索引擎蜘蛛(爬虫、机器人)IP地址段

别名:Sosospider臭名远扬,搜搜完全是在瞎折腾Sosospider让很多网站瘫痪,搜搜的技术太糟糕Soso的蜘蛛要把好多网站拖垮

关于“给搜搜蜘蛛(Sosospider)的信(请勿骚扰)”的留言:

留言: Soso在做自己的搜索引擎,和Google合作似乎快要到期了

新增相关留言