新闻小偷不是多得是吗?去www.chinaz.com搜。

解决方案 »

  1.   

    php已经有专门的采集器程序了,忘记名字了,楼主自己搜搜
      

  2.   

    读取对方某一个列表网页
    用正则,读取需要使用的列表区
    按<a切开
    连接每一个href
      

  3.   

    呵呵,看来你要搜索正确合适的内容的话,分词技术是少不了滴赶紧研究下搜索引擎的原理吧,呵呵!好像dedecms开发小组的分词技术还不错,就是不能识别姓名