急求利用POI提取WORD文档内容的方法!!!!
网上一搜全是那个什么四件兵器的例子,一大堆的问题,谁有过这方面的研究,拜托快帮帮我。
这个例子在导包的时候就有问题,POI包中根本没有他导的东东,大家帮帮我!!2. 用apache的poi来抽取word,excel。poi是apache的一个项目,不过就算用poi你可能都觉得很烦,不过不要紧,这里提供了更加简单的一个接口给你: 下载经过封装后的poi包: http://jakarta.apache.org/poi/ 下载之后,放到你的classpath就可以了,下面是如何使用它的一个例子: import java.io.*;
import org.textmining.text.extraction.WordExtractor;
/**
* <p>Title: word extraction</p>
* <p>Description: email:[email protected]</p>
* <p>Copyright: Matrix Copyright (c) 2003</p>
* <p>Company: Matrix.org.cn</p>
* @author chris
* @version 1.0,who use this example pls remain the declare
*/public class PdfExtractor {
public PdfExtractor() {
}
public static void main(String args[]) throws Exception
{
FileInputStream in = new FileInputStream ("c:\\a.doc");
WordExtractor extractor = new WordExtractor();
String str = extractor.extractText(in);
System.out.println("the result length is"+str.length());
System.out.println("the result is"+str);
}
}
网上一搜全是那个什么四件兵器的例子,一大堆的问题,谁有过这方面的研究,拜托快帮帮我。
这个例子在导包的时候就有问题,POI包中根本没有他导的东东,大家帮帮我!!2. 用apache的poi来抽取word,excel。poi是apache的一个项目,不过就算用poi你可能都觉得很烦,不过不要紧,这里提供了更加简单的一个接口给你: 下载经过封装后的poi包: http://jakarta.apache.org/poi/ 下载之后,放到你的classpath就可以了,下面是如何使用它的一个例子: import java.io.*;
import org.textmining.text.extraction.WordExtractor;
/**
* <p>Title: word extraction</p>
* <p>Description: email:[email protected]</p>
* <p>Copyright: Matrix Copyright (c) 2003</p>
* <p>Company: Matrix.org.cn</p>
* @author chris
* @version 1.0,who use this example pls remain the declare
*/public class PdfExtractor {
public PdfExtractor() {
}
public static void main(String args[]) throws Exception
{
FileInputStream in = new FileInputStream ("c:\\a.doc");
WordExtractor extractor = new WordExtractor();
String str = extractor.extractText(in);
System.out.println("the result length is"+str.length());
System.out.println("the result is"+str);
}
}
POI包里根本没有这些东西,谁有做过成功的,快告诉我!
import java.util.*;
import org.apache.poi.hpsf.*;
import org.apache.poi.poifs.eventfilesystem.*;
import org.apache.poi.poifs.filesystem.*;
import org.apache.poi.util.HexDump;public class ReadContext { public static void main(String[] args)
throws IOException
{
final String filename = "c:\\a.doc";
POIFSReader r = new POIFSReader(); /* Register a listener for *all* documents. */
r.registerListener(new MyPOIFSReaderListener());
r.read(new FileInputStream(filename));
} static class MyPOIFSReaderListener implements POIFSReaderListener
{
public void processPOIFSReaderEvent(POIFSReaderEvent event)
{
DocumentInputStream dis=event.getStream() ;
} }}