公司最近要做个项目,
语言不限,主要功能是实现从某一指定的网站上抽取其整个网站页面,
(类似爬虫技术,或者网站整站下载器,webzip等软件)。
即html格式的文件,gif,jpg,css这些文件抽不抽取是次要的,
主要是如何控制抽取的线程,如何抽取效率才高,稳定性好。各位有相关的经验,或者代码片段的推荐下多谢
语言不限,主要功能是实现从某一指定的网站上抽取其整个网站页面,
(类似爬虫技术,或者网站整站下载器,webzip等软件)。
即html格式的文件,gif,jpg,css这些文件抽不抽取是次要的,
主要是如何控制抽取的线程,如何抽取效率才高,稳定性好。各位有相关的经验,或者代码片段的推荐下多谢
解决方案 »
- java.lang.NoClassDefFoundError: Could not initialize class cn.elvis.utils.JdbcUt
- 关于数据录入及导出
- jsp连接数据库
- JSP和SQL Server2000连接失败的问题
- jsp
- 这个触发器错哪里了,帮忙给看一下
- 开发javaWEB应用程序,需要在服务器端作怎样配置?
- 在JSP中,java和JavaScript如何交互?
- 请问:哪里能下到tomcat5.0
- 如何搭建JSP开发平台?急急?
- 请问谁有ajax实现无刷新二级联动源代码啊或小项目!急急急
- 关于struts的基本问题(No getter method for property)
随便下