一个目录下面有许多的子目录,每个子目录下有一个html文件和一个和html文件关联的pdf文件,我想用java编个程序把所有的.html格式文件检索出来并且应用jtidy转换为xml格式的,再使用jdom解析xml文件(除去无用的冗余的显示信息)只需要得到里面的有用信息,生成另外一个标准的xml文件,把最后得到的xml和原来的pdf文件批量放到oracle数据库中,请问高手
1.如果可能的话程序应该如何编写?(给出分步代码也可)
2.如何解决使用jtidy转换成xml文件的中文字符问题?
3.解析xml文件使用jdom恰不恰当,如何使用?
4.最后的xml文件和pdf文件怎么一起入库?
拜托,多谢!
1.如果可能的话程序应该如何编写?(给出分步代码也可)
2.如何解决使用jtidy转换成xml文件的中文字符问题?
3.解析xml文件使用jdom恰不恰当,如何使用?
4.最后的xml文件和pdf文件怎么一起入库?
拜托,多谢!
解决方案 »
- swing怎么用代码促发监听事件
- JDBC连接SQL SERVER 2005
- 布局问题!!!
- 公司产品,JRE1.3升到JRE1.6,JTable不能用鼠标拖拉的方式多选了,请各位帮忙~
- 焦点在控件之间的移动
- static 加载的先后顺序???
- 谁能看懂这段代码?
- 自定义的数据类型,打包后两个应用无法匹配识别
- 请教大家一个问题!希望大虾指点!Hashtable在查找的时候如果里面有两个相同的value会发生什么问题!具体来看看好吗?朋友
- 请大虾解疑!关于Tomcat与Resin的区别,谢谢!!
- 带滚动条和默认文本的JTextArea,怎么显示前面部分的文本?默认是显示最后部分。
- 新手请教,今天突然无法编译java文件了。
2.可以先把汉字转成unicode,然后读出的时候在转回去
3.http://www.it.com.cn/f/edu/053/27/93819.htm你可以参考一下看你采用什么解析方式比较的合适
4.xml和pdf可以采用二进制的方式存入数据库,按照blob字段的存入方法写入数据库就可以吧个人意见,仅作参考
<?xml version="1.0" encoding="utf-8"?>
<html>
<body>
<table>
<tr>
<td>姓 名:</td>
<td>张三</td>
</tr>
<tr>
<td>年 龄:</td>
<td>20</td>
</tr>
</table>
</body>
</html>
怎么能转换成
<?xml version="1.0" encoding="utf-8"?>
<介绍>
<姓名>张三</姓名>
<年龄>20</年龄>
</介绍>
呢,其实<介绍><姓名><年龄>不需要从源文件提前,
只需要把“张三”和“20”从原来的xml文件中提取出来就好了