请问如何获取swt中browser的html源码 请问如何可以获取正在显示的页面的html源代码?getText()在大部分时候都可以工作,但是对一下网址就不行了http://www.sninfo.gov.cn:8083/initSnTwoPageArticleTypeList.do?method=initSnTwoPageArticleTypeList&articleTypeId=20550 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 直接用URLConnection读一下好了try { URLConnection conn = new URL("http://www.sninfo.gov.cn:8083/initSnTwoPageArticleTypeList.do?method=initSnTwoPageArticleTypeList&articleTypeId=20550").openConnection(); InputStream is = conn.getInputStream(); ByteArrayOutputStream os = new ByteArrayOutputStream(); int b = -1; while ((b = is.read()) != -1) { os.write(b); } os.flush(); String html = new String(os.toByteArray()); System.out.println(html); } catch (MalformedURLException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } 有没有人研究过browser的源代码?它是用什么办法获取网页文件的? 这个都是封装好的吧,因为还包括读取html包含的css和js等等。eclipse的话可以看下org.eclipse.swt.internal.mozilla,但好像都是一些事件的监听接口或DOM树的解析,就像js能做的一样。真正的html解析和渲染都没有提供api或者hook。 《搜索引擎零距离—基于Ruby+Java搜索引擎原理与实现》这本书里,我用的是基于lobobrowser的纯java浏览器,能够很好的解决HTML解析的问题,推荐使用。《搜索引擎零距离—基于Ruby+Java搜索引擎原理与实现》 清华出版社。http://www.huachu.com.cn/itbook/itbookinfo.asp?lbbh=10105450 我用httpclient包,模拟发送post请求,已经可以了,但是遇到一种比较特殊的post请求,求解 能否用正则表达式取出字符串中的这个信息? 关于对日期进行格式化的问题 我自己写了个抽屉菜单的类,怎么让把它生成的panel放到一个frame里面呢? C#和JAVA 关于I/O swing高手帮帮忙 如下语句为何出错? weblogic里难道只能调用一个.jsp,其它就不行了吗,郁闷。 关于使用paintComponent的一个问题 J2EE与VJ++6.0有什么区别,学J2EE好还是学VJ++6.0好呢?请指教? 求助。。查询方面的问题 图形界面 显示题目
try {
URLConnection conn = new URL("http://www.sninfo.gov.cn:8083/initSnTwoPageArticleTypeList.do?method=initSnTwoPageArticleTypeList&articleTypeId=20550").openConnection();
InputStream is = conn.getInputStream();
ByteArrayOutputStream os = new ByteArrayOutputStream();
int b = -1;
while ((b = is.read()) != -1) {
os.write(b);
}
os.flush();
String html = new String(os.toByteArray());
System.out.println(html);
} catch (MalformedURLException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
eclipse的话可以看下org.eclipse.swt.internal.mozilla,但好像都是一些事件的监听接口或DOM树的解析,就像js能做的一样。
真正的html解析和渲染都没有提供api或者hook。
我用的是基于lobobrowser的纯java浏览器,能够很好的解决HTML解析的问题,推荐使用。
《搜索引擎零距离—基于Ruby+Java搜索引擎原理与实现》 清华出版社。
http://www.huachu.com.cn/itbook/itbookinfo.asp?lbbh=10105450