公司最近要做个项目,
语言不限,主要功能是实现从某一指定的网站上抽取其整个网站页面,
(类似爬虫技术,或者网站整站下载器,webzip等软件)。
即html格式的文件,gif,jpg,css这些文件抽不抽取是次要的,
主要是如何控制抽取的线程,如何抽取效率才高,稳定性好。 各位有相关的经验,或者代码片段的推荐下
语言不限,主要功能是实现从某一指定的网站上抽取其整个网站页面,
(类似爬虫技术,或者网站整站下载器,webzip等软件)。
即html格式的文件,gif,jpg,css这些文件抽不抽取是次要的,
主要是如何控制抽取的线程,如何抽取效率才高,稳定性好。 各位有相关的经验,或者代码片段的推荐下
解决方案 »
免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货