想爬取一些购物信息
比如当当网、卓越亚马逊网站
这些网站允许爬虫爬吗?有没有什么限制之类的或者有没有提供接口?
还是什么网站都能爬的?
比如当当网、卓越亚马逊网站
这些网站允许爬虫爬吗?有没有什么限制之类的或者有没有提供接口?
还是什么网站都能爬的?
解决方案 »
- 关于新手的“冒泡排序”一个不解
- JAVA 串口接收数据 我已经能从串口发送数据 但不知道如何接收数据 请指教..
- Java混淆器的混淆原理
- 有什么打包工具可以把java工程打包成安装程序?该安装程序可以直接在windows下、linux下等直接安装的?
- 有没有获取系统时间的函数
- 一个初学者的问题(一定帮忙进来看看,拜托)
- 装了jb,命令行编译器在哪儿找啊?
- 有谁知道jbuilder7的序列号和注册码呢
- ===有搞LDAP的java高手吗?有问题请教啊!!!!!!!===
- hycao(海草),你在这个跟一个帖子,我把剩下的100分给你!
- HashMap怎么取出数组了。。
- 有没有java各个软件包里面常用类的方法的总结汇总
这个包可以模拟客户端去爬取网页的信息,具体返回的是html树结构,需要自己解析其中的内容。
现在好像java6自带有httpclient包,但是没用过。以前作毕业设计的时候用过apache的httpclient
做过机票抓取。
如果是ajax网站,则采用Jrex缓冲网页文件,存储在本地,在解析。
思路大概就是如此,google也有很多资料,可以搜搜'apache httpclient例子'