关于抓取网页信息如何自动分类的问题抓取网站的上信息 保存到本地现在的问题是不能按照网站的栏目信息进行自动分类
有什么好的技术思路吗

解决方案 »

  1.   

    再顶顶看 这个应该有人处理过的吧 
    应该不是很偏的东西
      

  2.   

    按照网页标题进行分类保存。
      

  3.   

    问题在于网页上好多栏目的分类都是在数据库里的 是动态网页
    前台页面的栏目分类没有啥唯一的标识,无法找出不同栏目的判断依据
      

  4.   

    是否有底层的技术可以处理这样的问题呢?
      

  5.   

    分析网页源代码。跟图片没有关系的