这个问题和以下的问题很类似,但是还没有完全解决,所以我再次在此提问!
问题点:
    想通过参数传入,获取与条件匹配的数据,但是数据较多,有翻页的功能。
    在“下一页”和“上一页”是通过调用js中的方法实现的,其中没有page这个参数。不知道如何依次获得全部数据?在这里也有一个类似的问题http://topic.csdn.net/t/20060123/17/4532240.html。如何编写一个程序自动获取页面上的数据?楼主guo99999(java半生)2006-01-23 17:20:44 在 Java / J2SE / 扩展类 提问
各位老大:我想从几个提供数据的网站的页面上将表中的数据自动抓下来,这些页面是带有翻页功能的.   
  这里有两点我现在不知如何处理:   
  1、我知道如何编程序将整个页面的代码及数据抓下来,但不知如何抓去我只想要的表中的具体数据。   
        而不是连同整个页面标记代码。   
  2、不知如何实现在抓取过程中的页面自动翻页。   
  还望高手指点! 
问题点数:80、回复次数:2
Top
 1 楼bionergy(活力四射)回复于 2006-01-24 09:47:45 得分 80把抓回来的页面的html代码用正则表达式查找一下,应该就能定位表中的数据,把他们给扣出来。翻页也是一样,找到   “下一页”   的href里面的地址,作为下一个页面的地址就行了。btw,正则表达式的api要jdk1.4以上才支持,在java.util.regex包里面,可以看一下jdk的文档或是网上找一下相关的例子。
Top2 楼guo99999(java半生)回复于 2006-01-25 13:59:03 得分 0 谢谢指教,我试试,要是能给个例子就更好了.
这里说的是href超连接,这个是可以实现的,但是现在在不知道该怎么做!