解决方案 »

  1.   

    网站文章的css中id或者class属性应该有很明显的标识,可以以此为锚点,做相应的过滤与搜索。
      

  2.   

    如果要去判断css的标识不好搞吧!每个网站的标识肯定不一样吧!
      

  3.   

    如果要去判断css的标识不好搞吧!每个网站的标识肯定不一样吧!你准备抓多少网站,十几个的话,很快就能理出头绪了。
    几百个的话……这个就不知道了。
      

  4.   

    内容页都会有 html 特征,你找找就好了。像有些页面用 <div id="content" 这样的事