我想编个程序,搜索一个论坛的某个用户在论坛的帖子,请高手指教!我的想法是先输入论坛地址然后获得论坛的所有链接,接下去遍历所有链接,完成搜索。但是我不知道用些什么函数能实现,比如怎么样通过输入的论坛地址获得它当前页面的所有链接,还有怎么获得用户ID,和怎么获得该用户ID的发帖内容,包括回帖的内容。
解决方案 »
- 要求用java实现读取超大文件
- 关于OO
- 关于java编写计算器的问题???
- 关于连接池的一个问题,请诸位帮忙
- 怎么在http://java.sun.com/既有j2se sdk5.0又有j2se jdk1.4??
- [200分]关于throws和throw和try{}catch(){}的区别和联系,书本上也说的迷迷糊糊,他们中的三种不知什么时候该使用!详细如下:
- 请教
- 初学JAVA 怎样编译JAVA文件(做了一个sample.java文件,不知道怎样编译)
- 用Jbuider需要电脑什么配置?
- java 泛型使用 LinkedList<? extends A> 出错 参数不适用
- java 多线程是否能实质性的改善程序执行效率
- 父类引用子类对象与子类引用子类对象有什么区别
如果把论坛所有数据都抓回来的话,需要考虑数据量——爬取时间——磁盘空间占用这些问题,还得考虑爬取过程总会不会被封掉
然后用正则表达式对这些页面进行处理,把类似的url弄出来。再用httpclient访问搞出来的url,获得页面。再用正则表达式提取你想要的内容。