基于整个Web的信息采集(Scalable Web Crawling)
增量式Web信息采集 (Incremental Web Crawling )
基于主题的Web信息采集(Focused Web Crawling )
基于用户个性化的Web信息采集(Customized Web Crawling )
基于Agent的信息采集(Agent Based Web Crawling )
迁移的信息采集(Relocatable Web Crawling )
基于元搜索的信息采集(Metasearch Web Crawling)
实际的采集器往往是几种采集技术的结合
Google Crawler, Mercator Web Crawler , Internet Archive,百度 。
增量式Web信息采集 (Incremental Web Crawling )
基于主题的Web信息采集(Focused Web Crawling )
基于用户个性化的Web信息采集(Customized Web Crawling )
基于Agent的信息采集(Agent Based Web Crawling )
迁移的信息采集(Relocatable Web Crawling )
基于元搜索的信息采集(Metasearch Web Crawling)
实际的采集器往往是几种采集技术的结合
Google Crawler, Mercator Web Crawler , Internet Archive,百度 。
解决方案 »
- Linux Create JarFile instance
- HashMap和Hashtable的区别
- 在java的函数中用 synchronized限定的函数与能够保证该函数内的多个sql完整执行
- 数组运算
- ResultSet 的updateString() 方法 的中文问题
- 虚拟机初始化异常?
- 2个都含有"*"(代表任意1位或多位)字符串匹配的问题~~
- 给自己找条后路,想学Java,大家能否根据我的基础介绍基本好书?来者有分!
- FileInputStream问题??高手请进...
- 调用applet的问题,请近来看看
- jvm file encoding怎么设定??
- MVC在GUI中的应用(请教)
楼上说的很有道理!不过我初学java,对这个不太懂!今天又学到东西了!