想抓取一个网站上的页面内容,但是那个网页需要登录才能打开.我有用户名和密码,用下面的方式可以登录成功,代码如下:URLConnection connection = new URL("http://localhost/login.jsp?user=test&pswd=123").openConnection();BufferedReader reader = new BufferedReader(new java.io.InputStreamReader(connection.getInputStream()));
String line = "";
while ((line = reader.readLine()) != null){
  System.out.println(line);
}
登录成功之后,用户的session被保留在服务器端.===================================================但是,再用这种方式去取需要权限的网页时,得到的还是未登录信息.代码如下:
connection = new URL("http://localhost/user.jsp").openConnection();reader = new BufferedReader(new InputStreamReader(connection.getInputStream()));
String line = "";
while ((line = reader.readLine()) != null){
  System.out.println(line);
}
读取失败,也就是说服务器那端没有用户session.
我猜可能是URLConnection对象被重新初始化了,所以才这样.那怎么才能将上面登录之后的session保留下来继续使用呢.
或者有别的什么办法可以突破验证抓取网页.