开发数据采集器都要用到什么知识点? 请高手指点迷津

解决方案 »

  1.   

    http://download.csdn.net/source/526942
      

  2.   

    http://www.zaoxue.com/down/code-169810.htm
      

  3.   

    串口 的方面的或USB方面的。
    线程方面。
    托管方面的。
      

  4.   

    1.网址基址,就是一个采集网站的入口地址。
    2.读取URL存好了。
    3.遍例URL,把你要的网站源码拿下来,以下就是分析源码。
    4.分析源码中的URL等信息,再存好了。
    5.去掉HTML,JS,CSS等相关标签。(HTML->TEXT)
    6.中文分词。
    7.foreach一下,再split一下,在split的同时存入数据库。
    8.线程(要是想提高速度,这个非常重要的)暂时就列这些吧。MSN:[email protected]