例如,<HU>但随着日子的流逝,Wiley也越长越大,</HU>
插入文本内容:“ 常常静静的伴在小主人身边陪伴着。”
或者将<HU></HU>标签对中的文本信息读出来存到MySql数据库中;请大家给个思路吧,我也不知道标签对的位子信息用java可以怎么处理,一点思路都没有.
插入文本内容:“ 常常静静的伴在小主人身边陪伴着。”
或者将<HU></HU>标签对中的文本信息读出来存到MySql数据库中;请大家给个思路吧,我也不知道标签对的位子信息用java可以怎么处理,一点思路都没有.
附一个用它读取xml文件中节点值的demo
package servlet.demo.beans.util;import java.io.IOException;
import javax.xml.parsers.*;
import org.w3c.dom.Document;
import org.xml.sax.SAXException;/**
* XML读取器,用于按标签读取XML文件
*
* @author HerveyHall
*
*/
public class XMLReader {
private static Document doc; /**
* 初始化一个XML读取器,并指定相对路径
*
* @param xmlFilePath
* 被读取的XML文件名
* @throws ParserConfigurationException
* 表示一个严重的配置错误。
* @throws IOException
* 输入/输出异常
* @throws SAXException
* 封装一般的SAX(simple API for XML,针对XML的简单API)错误或警告。
*/
public XMLReader(String xmlFilePath) throws SAXException, IOException, ParserConfigurationException {
xmlFilePath = xmlFilePath.replaceAll("\\\\", "/");// java中'\'是"\\",正则表达式中'\'也是"\\",所以是4条'\'
if (xmlFilePath.charAt(0) == '/')
xmlFilePath = xmlFilePath.replaceFirst("/", "");
doc = DocumentBuilderFactory.newInstance().newDocumentBuilder()
.parse(this.getClass().getClassLoader().getResource("") + xmlFilePath);
} /**
* 按照XML节点的标签名取得元素节点内第一个符合的值。用于唯一的标签
*
* @param tagName
* XML节点的标签名
* @return XML元素节点内的值
*/
public String getValue(String tagName) {
return getValue(tagName, 0);
} /**
* 按照XML节点的标签名取得元素节点内的值
*
* @param tagName
* XML节点的标签名
* @param index
* 标签名相同的节点之集合的索引。
* @return XML元素节点内的值
*/
public String getValue(String tagName, int index) {
return doc.getElementsByTagName(tagName).item(index).getFirstChild().getNodeValue();
}
}
DOC>
<DOCID>XIN.19960211.0308</DOCID>
<HEADER>
<DATE>1996-02-11</DATE>
</HEADER>
<BODY>
<HEADLINE>
<S ID="12">
<MTS ID="1" TYPE="Entity" POSITION="Theme" LOCATION="Root" KEY="Complex" RTYPE="NotZ" USETIME="37">文字</MTS>\文字
</S>
</HEADLINE>
</BODY>
</DOC>
原文该部分标签属性没有引号;
关键是文本挺多的,都加引号的话手动不现实啊,能用别的方式处理文本不(获得标签属性信息)?
如:<MTS ID=1 TYPE=Entity POSITION=Theme LOCATION=Root KEY=Complex RTYPE=NotZ USETIME=37>文字</MTS>
DOC>
<DOCID>XIN.19960211.0308</DOCID>
<HEADER>
<DATE>1996-02-11</DATE>
</HEADER>
<BODY>
<HEADLINE>
<S ID="12">
<MTS ID="1" TYPE="Entity" POSITION="Theme" LOCATION="Root" KEY="Complex" RTYPE="NotZ" USETIME="37">文字</MTS>\文字
</S>
</HEADLINE>
</BODY>
</DOC>
原文该部分标签属性没有引号;
关键是文本挺多的,都加引号的话手动不现实啊,能用别的方式处理文本不(获得标签属性信息)?
如:<MTS ID=1 TYPE=Entity POSITION=Theme LOCATION=Root KEY=Complex RTYPE=NotZ USETIME=37>文字</MTS>
public class Test{
public static void main(String[] args){
String content = "<HU>但随着日子的流逝,Wiley也越长越大,</HU>";
content = content.replaceAll("(?m)(?=</HU>)","常常静静的伴在小主人身边陪伴着。");
System.out.println(content);
}
}