htmlparser解析文件时可以出现
但是指定保存的文件里面没有怎么回事啊第一次接触好多不清楚,大家快来帮帮我爬虫和搜索

解决方案 »

  1.   


        /**  
         * 根据URL获得所有的html信息  
         *   
         * @param url  
         * @return  
         */  
        public static String getHtmlByUrl(String url) {   
            String html = null;   
            HttpClient httpClient = new DefaultHttpClient(); // 创建httpClient对象   
            HttpGet httpget = new HttpGet(url); // 以get方式请求该URL   
            try {   
                HttpResponse responce = httpClient.execute(httpget); // 得到responce对象   
                int resStatu = responce.getStatusLine().getStatusCode(); // 返回码   
                if (resStatu == HttpStatus.SC_OK) { // 200正常 其他就不对   
                    HttpEntity entity = responce.getEntity();   // 获得相应实体   
                    String charset = "UTF-8";  //设置编码
                    if (entity != null) {   
                        html = EntityUtils.toString(entity,charset); // 获得html源代码   
                    }   
                }   
            } catch (Exception e) {   
                System.out.println("访问【" + url + "】出现异常!");   
                e.printStackTrace();   
            } finally {   
               httpClient.getConnectionManager().shutdown();   
            }   
            return html;   
        }