想得到远程web服务器上的word,pdf等 文档的内容,现在能够通过HttpWebResponse和HttpWebRequest把word的字节流下载下来,并存到一字节数组中,但解码成字符型总是乱码,不知如何?
我用下面这句得到字符:System.Text.Encoding.GetEncoding("GB2312").GetString(arrBytes);其中
GetEncoding("UTF8"),ASCII,Default等都试过,都不行,远程web服务器上的word是中文的。
郁闷至极,恳请大虾出手。不胜感激。
我用下面这句得到字符:System.Text.Encoding.GetEncoding("GB2312").GetString(arrBytes);其中
GetEncoding("UTF8"),ASCII,Default等都试过,都不行,远程web服务器上的word是中文的。
郁闷至极,恳请大虾出手。不胜感激。
难道搜索引擎都是首先把这些字节流在本地保存成文档,再解析吗,感觉不太合乎实际阿。
把word文档的字节流写成word文档,把pdf的写成pdf文档。....
疑惑中