因为各页面编码不同,有的WEB服务器发送编码格式,有的没有发送,导致我下在下来的byte[]转化成string时出错,求能真正转化的代码。很多代码并不能对各种页面下载。(我已经测试过了)解决者另开贴送100分。谢谢。
相关问题:http://community.csdn.net/Expert/topic/5169/5169830.xml?temp=.6935846

解决方案 »

  1.   

    你针对的是全体的html么?还是只针对国内的?
      

  2.   

    我已经强调了,各页面编码不同,不要在发Encoding.Default.GetString(bytes)或者Encoding.UTF8.GetString(bytes)或者Encoding.。。.GetString(bytes)这样的代码了。这个不是我要的。
      

  3.   

    我尝试过 SreamReader的 (stream,true)
    但是没有效果
    sreamreader只是根据文件头来确定编码,但是html页面根本没有文件头的几个字符。我也尝试了拿出源文件中的META的charset。(先按utf-8解码,然后可以看到英文内容)
    但是也有问题,很多charset和编码不一致。
    而且需要抓取两次网页,steam也没有个clone方法.
    (现在用的就是这个方法)谁解决好这个问题,我也赠送200分