想得到远程web服务器上的word,pdf等 文档的内容,现在能够通过HttpWebResponse和HttpWebRequest把word的字节流下载下来,并存到一字节数组中,但解码成字符型总是乱码,不知如何?
我用下面这句得到字符:System.Text.Encoding.GetEncoding("GB2312").GetString(arrBytes);其中
GetEncoding("UTF8"),ASCII,Default等都试过,都不行,远程web服务器上的word是中文的。
郁闷至极,恳请大虾出手。不胜感激。

解决方案 »

  1.   

    把你所得到的字节流转换成字符,就相当于用记事本去打开Word文档一样,当然得到的是乱码啦.你可以把这个字节流写到本地重新生成文件再用Word打开啊
      

  2.   

    pdf也一样,他们本身都是二进制格式的,不能直接转换成字符串
      

  3.   

    谢了,sunsjorlin(周勇)和zangleo(行云流水) ;
    难道搜索引擎都是首先把这些字节流在本地保存成文档,再解析吗,感觉不太合乎实际阿。
    把word文档的字节流写成word文档,把pdf的写成pdf文档。....
    疑惑中