你上面读取得方式是按照字节流读取的,而doc是带格式的流文件,通过特定的编码才能获得正确的文字信息。
可能需要office第3方插件或者控件才能正确转换doc内容

解决方案 »

  1.   

    我察看了一些资料,现在考虑有可能要使用vba,在msdn中有这样一段vba代码,
    Sub MyMacro()Dim wrdConverter As FileConverter
        Dim strMessage As String
        Dim strPath As String
        
        'Get a name and location for the converted file.
        strMessage = "Enter a path and file name for the converted file."
        strPath = InputBox(strMessage)    For Each wrdConverter In Word.FileConverters
            'If found, Save As, then exit the loop.
            If wrdConverter.ClassName = "HTML" Then
                ActiveDocument.SaveAs _
                    FileName:=strPath, _
                    FileFormat:=wrdConverter.SaveFormat
                Exit For
            End If
        Next wrdConverterEnd Sub将word文档转变为html文档,现在我想能不能通过vba将word文档转变为文本文档,然后再对文本文档进行操作?在asp.net中怎么样调用word的vba呢?本人这方面实在太菜,希望有这方面的高手不吝赐教,谢谢!
      

  2.   

    哦,上面的代码是word中一段宏的代码。
      

  3.   

    添加对word组件的引用,找开word文档,然后参考vba对word直接进行操作