急求利用POI提取WORD文档内容的方法!!!!
网上一搜全是那个什么四件兵器的例子,一大堆的问题,谁有过这方面的研究,拜托快帮帮我。
这个例子在导包的时候就有问题,POI包中根本没有他导的东东,大家帮帮我!!2. 用apache的poi来抽取word,excel。poi是apache的一个项目,不过就算用poi你可能都觉得很烦,不过不要紧,这里提供了更加简单的一个接口给你: 下载经过封装后的poi包: http://jakarta.apache.org/poi/ 下载之后,放到你的classpath就可以了,下面是如何使用它的一个例子: import java.io.*;
import  org.textmining.text.extraction.WordExtractor;
/**
 * <p>Title: word extraction</p>
 * <p>Description: email:[email protected]</p>
 * <p>Copyright: Matrix Copyright (c) 2003</p>
 * <p>Company: Matrix.org.cn</p>
 * @author chris
 * @version 1.0,who use this example pls remain the declare
 */public class PdfExtractor {
  public PdfExtractor() {
  }
  public static void main(String args[]) throws Exception
  {
  FileInputStream in = new FileInputStream ("c:\\a.doc");
  WordExtractor extractor = new WordExtractor();
  String str = extractor.extractText(in);
  System.out.println("the result length is"+str.length());
   System.out.println("the result is"+str);
}
}

解决方案 »

  1.   

    import  org.textmining.text.extraction.WordExtractor;
    POI包里根本没有这些东西,谁有做过成功的,快告诉我!
      

  2.   

    import java.io.*;
    import java.util.*;
    import org.apache.poi.hpsf.*;
    import org.apache.poi.poifs.eventfilesystem.*;
    import org.apache.poi.poifs.filesystem.*;
    import org.apache.poi.util.HexDump;public class ReadContext {  public static void main(String[] args)
          throws IOException
      {
        final String filename = "c:\\a.doc";
        POIFSReader r = new POIFSReader();      /* Register a listener for *all* documents. */
        r.registerListener(new MyPOIFSReaderListener());
        r.read(new FileInputStream(filename));
      }  static class MyPOIFSReaderListener implements POIFSReaderListener
      {
        public void processPOIFSReaderEvent(POIFSReaderEvent event)
        {
           DocumentInputStream dis=event.getStream() ;
        }  }}