最近做了一个小项目,需要用java部分预览本机和其他服务器的doc和ppt文件,我用tm-extractors-0.4_zip插件可已把doc文件转换成txt文件,但是url只能用D:/##/##/1.doc这种格式,而不能使用http://192.168.##.##:8080/##/1.doc这种格式,请问各位高手这种问题应该怎么解决? 还有ppt部分预览应该怎么实现,我使用tomcat服务器...
问题补充:import java.io.File;
import java.io.FileInputStream;
import org.textmining.text.extraction.WordExtractor;
public class WordReader { public static String readDoc(String doc) throws Exception {
// 创建输入流读取DOC文件
FileInputStream in = new FileInputStream(new File(doc));
WordExtractor extractor = null;
String text = null;
// 创建WordExtractor
extractor = new WordExtractor();
// 对DOC文件进行提取
text = extractor.extractText(in);
return text;
} public static void main(String[] args) {
try { String text = WordReader.readDoc("http://192.168.107.108:8080/resources/1.doc"); System.out.println(text);
System.out.println(text.length()); } catch (Exception e) {
e.printStackTrace();
}
}
}
这是实现的代码
直接访问本机webapps下面的文件都不行,但是用磁盘路径可以访问到.
问题补充:import java.io.File;
import java.io.FileInputStream;
import org.textmining.text.extraction.WordExtractor;
public class WordReader { public static String readDoc(String doc) throws Exception {
// 创建输入流读取DOC文件
FileInputStream in = new FileInputStream(new File(doc));
WordExtractor extractor = null;
String text = null;
// 创建WordExtractor
extractor = new WordExtractor();
// 对DOC文件进行提取
text = extractor.extractText(in);
return text;
} public static void main(String[] args) {
try { String text = WordReader.readDoc("http://192.168.107.108:8080/resources/1.doc"); System.out.println(text);
System.out.println(text.length()); } catch (Exception e) {
e.printStackTrace();
}
}
}
这是实现的代码
直接访问本机webapps下面的文件都不行,但是用磁盘路径可以访问到.
解决方案 »
- 100以内素数我这个怎么改出来
- “所见即所得”GUI设计器的原理是什么?为什么设计期间能得到运行期间的效果?
- 一个执行的线程调用了sleep方法,是否立即休眠
- java 调用DLL(DLL本是给C#调用的,java 能否调用)
- 请问我用鼠标点击JTable中的一行数据,怎么使数据在JTextField 中显示,谢谢!! 在线等.....
- 高薪急诚聘家庭兼职、大学生兼职、办公室兼职、计算机兼职----人人都适合!
- 困惑ing----为什么会这样???
- 大家能否帮我解决一个关于读文件的问题,谢谢!
- 急死我了,一向用c,突然要用java做组件,怎么办!!!!!!
- JAVA自学网站
- 关于java BCD码的运算支持?
- java里继承的优点和缺点
这样是无法直接读取文件的,需要先下载
1、得到服务器路径,http://192.168.##.##:8080/
2、页面拼接后面部分形成链接地址
我这个在线预览服务器txt文件可以了,但是,如果服务器中的文件数据有上万条的话,
打开时就会很慢,现在正想有没有别的方法实现,期待大家帮忙解决!
谢谢
import java.io.FileInputStream;
import org.textmining.text.extraction.WordExtractor;
public class WordReader { public static String readDoc(String doc) throws Exception {
// 创建输入流读取DOC文件
//FileInputStream in = new FileInputStream(new File(doc));
URL url = new URL("doc");
WordExtractor extractor = null;
String text = null;
// 创建WordExtractor
extractor = new WordExtractor();
// 对DOC文件进行提取
text = extractor.extractText(url.openStream());
return text;
} public static void main(String[] args) {
try { String text = WordReader.readDoc("http://192.168.107.108:8080/resources/1.doc"); System.out.println(text);
System.out.println(text.length()); } catch (Exception e) {
e.printStackTrace();
}
}
}