web项目中需要大量数据,指导老师说用网络爬虫,但是在网上看了很多都不是很懂,求大神指点怎么使用,我需要一个旅游网站的景点图片,和文字信息,我应该怎样将爬下来的东西进行分类,为我所用?网络爬虫
解决方案 »
- 不支持此服务器版本。目标服务器必须是 SQL Server 2000 或更高版本。求解
- 关于struts的问题,请求支援
- 下拉列表怎么出不来呀呢?
- FileOutputStream("file")关闭问题
- 提问: web中singleton的范围,spring中singleton的范围
- 关于表单循环提交数据求助?
- 如何用jsp实现table中一行显示多条记录,附录对应的asp程序以供参考
- 浏览器在默认情况下把浏览过的网页保存在缓冲区,请问如何阻止
- 在jsp中怎样用替换函数replace呢..
- 如何用javac命令一次编译整个包的文件?
- 求助!apache+mod_jk+tomcat,在运行一段时间后tomcat报outofmermory,然后jk再也连接不上tomcat
- 马士兵的金尚网上商城源代码不能运行
2.获取连接的InputStream
3.InputStream 转化为String
4.正则表达式匹配标签为img的然后下载保存
- 通过java.net包下的工具类实现后台发送http请求以及获取响应内容。
- 分析其页面结构,找到符合自己的数据或者链接
- 将抓取下来的数据持久化
- 将上三部逻辑弄到TimerTask,用Timer调度,定期执行