我知道怎样做,但是没有作过,不好意思了WORD:
    我用的是Office XP,在MS站点上提供了XP的.Net接口,可以用C#编程得到所有的文字HTML:
    如果想得到“<a> XXXX</a>”形式的,可以直接用Socket的子类建立Http联结,读取到的就是了,如果想得到文字“XXXX”有些麻烦,需要区分哪些是控制符哪些是文字,如“<a><<b>XXXX</b>></a>”,Html的知识我不太懂,不好讲了,但我想是可以穷举的吧!以下是我想到的情况:
页面中有Script,有对其他页面的引用如Frame,有对B端Cookie的读取等,另外,如果文字在图片里的就不好办

解决方案 »

  1.   

    没关系 还是谢谢你 我是个新手 许多还不懂 怎么给你分 关于word说的再详细点行吗?
      

  2.   

    项目添加引用microsoft word 10 object libraryWord.Application app = new Word.ApplicationClass();
    app.Visible = false;
    string strFile = "c:\\bbb.doc";
    object obj = System.Reflection.Missing.Value;
    Object infile = (object)strFile;
    Word.Document doc = app.Documents.Open(ref infile, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj);
    string strnew = "c:\\bbb.txt";
    Object outfile = (object)strnew;
    Object fmt = (object)Word.WdSaveFormat.wdFormatText;
    doc.SaveAs(ref outfile, ref fmt, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj);
    doc.Close(ref obj, ref obj, ref obj);
    app.Quit();
    app = null;
      

  3.   

    ok!doc.SaveAs(ref outfile, ref fmt, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj);Word.Document doc = app.Documents.Open(ref infile, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj, ref obj);不会有这么多的参数吧?我没有使用过Word 10 的库,请问可否用C#访问到这样一个属性:某个文档整体的页数?我用C#无法得到Word.XP的页数(或者是我还没有找到)但是在Word.XPd的VBA中可以很清楚的找到这样的属性,可以读取当前文档的页数,是不是在XP中该属性是非公有的呢?在XP中如何得到文档的页数?在Word 2k中是否是公有的呢?加分。
      

  4.   

    word是打开后显示出来时计算word要显示多少页,它的页数不是个固定值vba是在一个已打开的word里执行,应该可以取到不知我说的对不对
      

  5.   

    http://www.codeproject.com/useritems/WordApplication.asp