因为各页面编码不同,有的WEB服务器发送编码格式,有的没有发送,导致我下在下来的byte[]转化成string时出错,求能真正转化的代码。很多代码并不能对各种页面下载。(我已经测试过了)解决者另开贴送100分。谢谢。
相关问题:http://community.csdn.net/Expert/topic/5169/5169830.xml?temp=.6935846
相关问题:http://community.csdn.net/Expert/topic/5169/5169830.xml?temp=.6935846
但是没有效果
sreamreader只是根据文件头来确定编码,但是html页面根本没有文件头的几个字符。我也尝试了拿出源文件中的META的charset。(先按utf-8解码,然后可以看到英文内容)
但是也有问题,很多charset和编码不一致。
而且需要抓取两次网页,steam也没有个clone方法.
(现在用的就是这个方法)谁解决好这个问题,我也赠送200分