不明白采集的步骤是什么我现在知道单条采集,多条的话是都读了再去采集,还是读一条采集一条?

解决方案 »

  1.   

    1.设置采集源的页地址,和页面编码;(其实页面编码完全可以用程序自动识别,可以用正则表达式也可以用字符处理函数) 
    2.获取页内容后,设置采集要点的起始字符串和结束字符串,中间的就是我们要的内容;(这也是字符处理相关内容,和上面一样也可以用正则表达式和相应函数) 
    3.得到采集要点,以后就是细节处理了,变成自己的东西因人而异。 可以通过多线程,使用异步方式进行采集。
    请参考:
    http://www.gkj.com.cn/default.asp?tag=%E9%87%87%E9%9B%86