怎样用java读取网页的内容? 怎样用java读取网页的内容,因为我想将网页中的内容转换成pdf文档? 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 URLConnection可以搞定,不过好怎么转成pdf就不知道了 我说一个方法:1、得到网页的url(当然了,没有这个没法取网页);2、用url创建一个InetAddress对象,并用它创建一个Socket对象;3、从Socket对象得到InputStream和PrintStream;4、按照http协议向PrintStream写数据(就是GET URL HTTP/1.0\R\N HOST:...,实际上是给服务器一个请求,就象ie访问一样);5、从InputStream取得响应头,分析里面的http状态码,如果是2**的话,说明访问成功,同时监测Location头,看是否有转向。如果转向的话,按照上面的方法继续访问。6、如果没有上述的意外情况,在响应头后面有一个空行,然后的内容就是html文件了。7、好要注意比如连接超时、socket异常等情况,需要分别处理,比如重试或者终端连接等等。 如果想把得到的文件转成pdf文件,最简单的办法是找一个html2pdf的工具,然后用java方法带参数启动这个转换程序。另外,我不知道Adobe公司是否有pdf文档的专用java api库,如果有的话,用哪个导也可以。 Eclipse运行含多个类的java程序,为什么老跳出Ant build对话框 JAVA运行问题!急 100分求解一个加密问题,不知道是用什么编码的,解决给分!!!谢谢!!! 窗体初始化时怎样是最大显示 请教高手关于对压缩文件读写的问题 求救!关于在XP,sp2状态下无法的打印问题。SOS 关于移动鼠标指针?? 初学java,对throw 抛出个新异常不很理解。请哪为高人可以帮忙解释下么?谢谢 救命呀~~~~~~~ java发布时提交给客户的是一个个jar么? 为什么connection refused 呢? 为什么Dom4j解析出来的xml元素都是空值呢?
1、得到网页的url(当然了,没有这个没法取网页);
2、用url创建一个InetAddress对象,并用它创建一个Socket对象;
3、从Socket对象得到InputStream和PrintStream;
4、按照http协议向PrintStream写数据(就是GET URL HTTP/1.0\R\N HOST:...,实际上是给服务器一个请求,就象ie访问一样);
5、从InputStream取得响应头,分析里面的http状态码,如果是2**的话,说明访问成功,同时监测Location头,看是否有转向。如果转向的话,按照上面的方法继续访问。
6、如果没有上述的意外情况,在响应头后面有一个空行,然后的内容就是html文件了。
7、好要注意比如连接超时、socket异常等情况,需要分别处理,比如重试或者终端连接等等。