我想要抽取某个网站的内容,例如http://www.china-pub.com/,我想把在这个网站上搜索到的内容抽取出来作处理。。我怎么获得这些搜索内容,具体就是我通过URLConnection建立连接获得流时,url应该是什么?我在这个网站上输入一个关键字后,关键字前的URL是:http://www.china-pub.com/s/?key1=

解决方案 »

  1.   

     HttpURLConnection urlConn = (HttpURLConnection)destURL.openConnection();
         urlConn.setRequestMethod("POST");
         urlConn.setDoOutput(true);     // 需要向服务器写数据
         urlConn.setDoInput(true);      // 
         urlConn.setUseCaches(false);   // 获得服务器最新的信息
         urlConn.setAllowUserInteraction(false); 
         urlConn.setRequestProperty("Content-type","application/x-www-form-urlencoded");
         // 必须告诉服务器你发送的数据大小. 这也同样告诉 
         urlConn.setRequestProperty("Content-length", ""+request.length());
         DataOutputStream outStream = new DataOutputStream(urlConn.getOutputStream());      outStream.writeBytes(request);
         outStream.close();                   BufferedReader in = new BufferedReader(new InputStreamReader(urlConn.getInputStream(),"gb2312"));