能给我一份吗?

解决方案 »

  1.   

    网页正文是只body里面的所有东西吗
      

  2.   

    可以通过 页面 HTML 代码密度来提取 。。但是提取出来的东西 存在有 不需要的内容
    精确匹配还需要你用正则来匹配
      

  3.   

    给你个思路 代码自己写一般新闻站都用了 cms 内容管理系统. 页面也都是有固定模板的所以每个新闻的页面内容结构也相对固定所以 随便找偏 查看源码 然后用正则过滤出来即可.
      

  4.   

    要的是不是小偷程序啊、  抓取别人网站的一块内容是吧、PHP小偷、、
    偷个天气预报什么的是不是LZ要的、QQ:527468431  要咪我
      

  5.   

    楼主能把程序发个我看看吗 不胜感激 邮箱[email protected]