读取txt文档的方法和读取word文档的方法有何不同呀?
word文档和txt文档的格式有什么不同呀?
我写了一个函数,是读取txt文档的,完全正常。但是如果用它来读取word文档的话
程序可以运行,但是就是读出来的内容乱了。也就是说,word文档和txt记事本在计算机中的格式不一样,应该如果读取呀?谢谢
最好有一个例子

解决方案 »

  1.   

    你要想读WORD文档,先要知道此文档的内部结构,所以你必须先向MS买一份规范,但我估计就他肯卖,你也不定买得起。可以到LINUX论谈去找找,有不不定有不要钱的原码哟!!
      

  2.   

    txt文档里纯粹是字符。word文档就不是了。word里有一些word自己规定的协议。比如说:一个段落使用10号子体写的,但其中有一个字使用15号子体写的,你在看这个段落时只是看到大小写的不同,但是word内部就不是这样了。为了直到你选用的子体,他会在那个15号子体的前面插入一个内部特殊标记,表示15号子体。所以你用打开txt文档的方法读取word文档会失败。
      

  3.   

    _Application application;
    _Document document;
    Range range;
    //初始化document = application->GetActiveDocument();
    range = document.GetContent();
    BSTR text;
    range->get_Text(&text);
    //text里保存的是纯文本