日志里很多  (compatible;+MSIE+6.0;+Windows+NT+5.1;+SV1;+Mozilla/4.0(Compatible+Mozilla/4.0EmbeddedWB-+14.59++from:+http://bsalsa.com/+)
的访问记录,搜出来的结果都是说是delphi的浏览器控件,的确是有这么个控件,好像也有这样一个外国的引擎。不过我的感觉是采集器。

今天直接搜采集器了,发现挺匹配的:)

有兴趣的可以看看这个:http://blog.csdn.net/laolaowhn/archive/2008/09/16/2936475.aspx

  1. wr.Method = "get";
  2.                 wr.Accept = "*/*";
  3.                 wr.Headers.Add("Accept-Language:   zh-cn");
  4.                 wr.Headers.Add("UA-CPU:   x86");
  5.                 wr.Headers.Add("Accept-Encoding:   gzip, deflate");
  6.                 wr.UserAgent = "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1;  Embedded Web Browser from: http://bsalsa.com/; InfoPath.2; .NET CLR 2.0.50727; .NET CLR 3.0.04506.648; .NET CLR 3.5.21022)";
  7.                 wr.KeepAlive = true;
  8.                 wr.ServicePoint.Expect100Continue = false;
  9.                 wr.AllowAutoRedirect = false;
  10.                 wr.Timeout = 30000;

再看看这个:http://www.zydn.net/bbs/bbs.asp?t=49&id=7852&p=1&s=default

再看看你日志里对应的IP,就基本可以确定是否是采集了。

我已经把相应的IP屏蔽了,采集是很让人讨厌的。哪位看官知道直接屏蔽bsalsa.com这样的userAgent看看怎么禁止掉,比屏蔽IP要好了

------------------12.11 今天发现一个说:TT用的useragent就是这个东西,唉,相当的麻烦。。。。