读取word文档的内容,可以用catdoc先把word转换为text然后再读取
否则直接读会是乱码
关于再把text转换为html,除非这个word文档的内容本身就是html的那些标记,那就直接把读取出来的字符串写入一个文件再把这个文件另存为.html格式的文件就可以了
如果word文档的内容是一些普通文字,那就不晓得该咋弄了

解决方案 »

  1.   

    word中还含有图片,这是一定要处理
      

  2.   

    我也知道要用com
    怎么调用是个问题
      

  3.   

    我的想法是用com打开一个word文档,然后用saveas存为html,不知道这样行不行?
      

  4.   

    你要知道在linux下面没有com啊!你怎么调用啊??
      

  5.   

    你要说的转换是在什么层面上的呢,好多html编辑器可以做到的,可以参考一下里面的javascript脚本,可能会对你有用
      

  6.   

    php下可以调用com的吧!只是在linux下面不行!