java的crawler 有什么?

基于整个Web的信息采集(Scalable Web Crawling)
增量式Web信息采集 (Incremental Web Crawling )
基于主题的Web信息采集(Focused Web Crawling )
基于用户个性化的Web信息采集(Customized Web Crawling )
基于Agent的信息采集(Agent Based Web Crawling )
迁移的信息采集(Relocatable Web Crawling )
基于元搜索的信息采集(Metasearch Web Crawling)
实际的采集器往往是几种采集技术的结合
Google Crawler, Mercator Web Crawler , Internet Archive，百度。