网页信息抽取

用java写的抽取一个网站信息的代码，为什么读取网页源代码的时候，第一个字符读不出来呢
如<html>读出来的是html> </div> 读出来是 /div>
显示html代码部分的java代码是：URL testURL = new URL(url);
URLConnection connection = testURL.openConnection();
connection.connect();

InputStream urlStream = connection.getInputStream();
BufferedReader urlreader = new BufferedReader(new InputStreamReader(urlStream));while(urlreader.read() > 0){
String str = urlreader.readLine();
System.out.println(str);
}

解决方案 »

免费领取超大流量手机卡，每月29元包185G流量+100分钟通话, 中国电信官方发货

此回复为自动发出,仅用于显示而已，并无任何其他特殊作用
楼主【sling2007】截止到2008-07-18 17:25:31的历史汇总数据(不包括此帖)：
发帖的总数量:37                       发帖的总分数:490                      每贴平均分数:13
回帖的总数量:43                       得分贴总数量:12                       回帖的得分率:27%
结贴的总数量:36                       结贴的总分数:470
无满意结贴数:10                       无满意结贴分:180
未结的帖子数:1                        未结的总分数:20
结贴的百分比:97.30 %               结分的百分比:95.92 %
无满意结贴率:27.78 %               无满意结分率:38.30 %
值得尊敬
String str = null;
while((str=urlreader.readLine())!=null){
  System.out.println(str);
}你的read已经把第一个字符读走了。呵呵
你已经在while里把这个字符read了.....
urlreader.read() > 0
改为：
urlreader.read() ！＝－1