如题,如何提取网页中想要的信息并保存到text文件中!
解决方案 »
- 新手求教jsp标签问题
- 推荐一款笔记本 物美价廉 。。。。
- tomcat配置jndi问题
- jsp添加 不刷新
- 关于FCKeditor保存信息取出至FCKeditor中的问题?
- ×××如何在java中生成一个GUID值???
- struts 的问题
- 在一个BEAN里调用另一个BEAN问题???
- tomcat 下http://localhost:8080/movie/1.rm为什么不能播放???
- 新手求救,spring mvc使用注解方式,为什么实体bean需要在程序中new一下,而dao层的就是注入一下,不需要new了
- 关于输出word问题。(急,在线等。。。)
- 在servlet中out.flush() 和 response.sendRedirect() 互相影响
首先根据url拿到目标页面的文本,然后正则过滤出需要的,以及该页面内的所有链接
对获得的链接与目前拥有的链接比对,去掉访问过的,得到还未进行爬取的进行再次处理这样层层向外