用java写的抽取一个网站信息的代码,为什么读取网页源代码的时候,第一个字符读不出来呢
如<html>读出来的是html> </div> 读出来是 /div>
显示html代码 部分的java代码是:URL testURL = new URL(url);
URLConnection connection = testURL.openConnection();
connection.connect();
InputStream urlStream = connection.getInputStream();
BufferedReader urlreader = new BufferedReader(new InputStreamReader(urlStream));while(urlreader.read() > 0){
String str = urlreader.readLine();
System.out.println(str);
}
如<html>读出来的是html> </div> 读出来是 /div>
显示html代码 部分的java代码是:URL testURL = new URL(url);
URLConnection connection = testURL.openConnection();
connection.connect();
InputStream urlStream = connection.getInputStream();
BufferedReader urlreader = new BufferedReader(new InputStreamReader(urlStream));while(urlreader.read() > 0){
String str = urlreader.readLine();
System.out.println(str);
}
楼主【sling2007】截止到2008-07-18 17:25:31的历史汇总数据(不包括此帖):
发帖的总数量:37 发帖的总分数:490 每贴平均分数:13
回帖的总数量:43 得分贴总数量:12 回帖的得分率:27%
结贴的总数量:36 结贴的总分数:470
无满意结贴数:10 无满意结贴分:180
未结的帖子数:1 未结的总分数:20
结贴的百分比:97.30 % 结分的百分比:95.92 %
无满意结贴率:27.78 % 无满意结分率:38.30 %
值得尊敬
while((str=urlreader.readLine())!=null){
System.out.println(str);
}你的read已经把第一个字符读走了。呵呵
改为:
urlreader.read() != -1