感觉挺难的
解决方案 »
- 对字符进行解析
- 高分!HttpClient提交数据到服务器出现异常:Content-Length header already present
- 请问大家Option类下面的argName方法得到参数名称怎么个用,,帮忙写个例子出来!!谢谢
- 多线程的通信问题,麻烦大家帮我看看
- 在JAVA里处理中文的能力就那么烂?
- 问一个有关quartz定时器的问题
- 请教package问题?
- thread
- 在ms-dos中用javac调试java.很多东西比如java_home,classpath等如何设置?
- 请问session bean中如何获得当前登陆的用户名?
- 调亿美的短信发送接口,现在要群发短信,想设计一个java线程群发短信。
- 求教一个完全背包问题 部分装入无法实现 求解决方案
poi是apache的一个项目,不过就算用poi你可能都觉得很烦,不过不要紧,这里提供了更加简单的一个接口给你:
下载经过封装后的poi包:http://www.matrix.org.cn/down_view.asp?id=14
这个包就是:tm-extractors-0.4.jar
下载之后,放到你的classpath就可以了,下面是如何使用它的一个例子:
import java.io.*;
import org.textmining.text.extraction.WordExtractor;
/**
*
Title: pdf extraction
*
Description: email:[email protected]
*
Copyright: Matrix Copyright (c) 2003
*
Company: Matrix.org.cn
* @author chris
* @version 1.0,who use this example pls remain the declare
*/public class PdfExtractor {
public PdfExtractor() {
}
public static void main(String args[]) throws Exception
{
FileInputStream in = new FileInputStream ("c:\\a.doc");
WordExtractor extractor = new WordExtractor();
String str = extractor.extractText(in);
System.out.println("the result length is"+str.length());
System.out.println("the result is"+str);
}
}