用java写的抽取一个网站信息的代码,为什么读取网页源代码的时候,第一个字符读不出来呢
如<html>读出来的是html>   </div> 读出来是 /div>   
显示html代码 部分的java代码是:URL testURL = new URL(url);
URLConnection connection = testURL.openConnection();
connection.connect();

InputStream urlStream = connection.getInputStream();
BufferedReader urlreader = new BufferedReader(new InputStreamReader(urlStream));while(urlreader.read() > 0){
String str = urlreader.readLine(); 
System.out.println(str);
 }

解决方案 »

  1.   

    此回复为自动发出,仅用于显示而已,并无任何其他特殊作用
    楼主【sling2007】截止到2008-07-18 17:25:31的历史汇总数据(不包括此帖):
    发帖的总数量:37                       发帖的总分数:490                      每贴平均分数:13                       
    回帖的总数量:43                       得分贴总数量:12                       回帖的得分率:27%                      
    结贴的总数量:36                       结贴的总分数:470                      
    无满意结贴数:10                       无满意结贴分:180                      
    未结的帖子数:1                        未结的总分数:20                       
    结贴的百分比:97.30 %               结分的百分比:95.92 %                  
    无满意结贴率:27.78 %               无满意结分率:38.30 %                  
    值得尊敬
      

  2.   

    String str = null;
    while((str=urlreader.readLine())!=null){ 
      System.out.println(str); 
    }你的read已经把第一个字符读走了。呵呵
      

  3.   

    你已经在while里把这个字符read了.....
      

  4.   

    urlreader.read() > 0
    改为:
    urlreader.read() != -1