如题 原因

解决方案 »

  1.   

    public String GetWebsiteContent(String URL, String charset) {
    String website_content;
    StringBuffer StrBuf = new StringBuffer(); HttpClient httpclient = new DefaultHttpClient();
    httpclient.getParams().setParameter(CoreProtocolPNames.WAIT_FOR_CONTINUE, 10000 );
    HttpGet httpget = new HttpGet(URL);
    try {
    HttpResponse response = httpclient.execute(httpget);
    if (response.getStatusLine().getStatusCode() == HttpStatus.SC_OK) {
    HttpEntity entity = response.getEntity();
    if (entity != null) {
    BufferedReader reader = new BufferedReader(new InputStreamReader(entity.getContent(), charset));
    int l;
    char[] cbuf = new char[2048];
    while ((l = reader.read(cbuf)) != -1) {
    String str = new String(cbuf);
    StrBuf.append(str);
    } }
    }
    website_content = StrBuf.toString(); } catch (Exception e) {
    System.out.println("open url error!!");
    website_content = "";
    } return website_content;
    }
      

  2.   


    请使用EntityUtils.toString 它有处理编码问题 
      

  3.   

    谢谢 解决了大部分问题 但是还有一点问题 就是 <script>......</script> 后的一部分html也消失了 不知道原因所在 我是通过比较chrome 的page source 和 httpclient 获取的html 比较时候发现的
      

  4.   

    是这样的  <script>.........</script> 跟了一个table 然后 那个table 整个消失不见了