我想 用java 抓取www.baidu.com 所有的网页??? 那位能给说说??
包括 网页的地址、网页的主题、网页的主题 我想分三个部分抓取。然后在放到自己的数据库中,该怎么设计??
有好的思想和建议 可以提示一下不胜感激,有写代码可借鉴更好  谢谢!!

解决方案 »

  1.   

    此回复为自动发出,仅用于显示而已,并无任何其他特殊作用
    楼主【shaoguangbing】截止到2008-07-04 15:12:36的历史汇总数据(不包括此帖):
    发帖的总数量:18                       发帖的总分数:470                      
    结贴的总数量:10                       结贴的总分数:300                      
    无满意结贴数:1                        无满意结贴分:20                       
    未结的帖子数:8                        未结的总分数:170                      
    结贴的百分比:55.56 %               结分的百分比:63.83 %                  
    无满意结贴率:10.00 %               无满意结分率:6.67  %                  
    楼主加油
      

  2.   

    www.baidu.com 搜索引擎就是抓取别个的网页的,你还抓他的。
      

  3.   

    调用web search service(有yahoo google的) 返回你想要的