java 文本信息处理（向一对标签中插入文字内容，或读出文本内容）

例如，<HU>但随着日子的流逝，Wiley也越长越大，</HU>
插入文本内容：“ 常常静静的伴在小主人身边陪伴着。”
或者将<HU></HU>标签对中的文本信息读出来存到MySql数据库中；请大家给个思路吧，我也不知道标签对的位子信息用java可以怎么处理，一点思路都没有.

解决方案 »

免费领取超大流量手机卡，每月29元包185G流量+100分钟通话, 中国电信官方发货

这个是xml吧，用jdk里自带的w3c的DOM解析工具呀
附一个用它读取xml文件中节点值的demo
package servlet.demo.beans.util;import java.io.IOException;
import javax.xml.parsers.*;
import org.w3c.dom.Document;
import org.xml.sax.SAXException;/**
* XML读取器，用于按标签读取XML文件
*
* @author HerveyHall
*
*/
public class XMLReader {
private static Document doc; /**
* 初始化一个XML读取器，并指定相对路径
*
* @param xmlFilePath
*            被读取的XML文件名
* @throws ParserConfigurationException
*             表示一个严重的配置错误。
* @throws IOException
*             输入/输出异常
* @throws SAXException
*             封装一般的SAX(simple API for XML,针对XML的简单API)错误或警告。
*/
public XMLReader(String xmlFilePath) throws SAXException, IOException, ParserConfigurationException {
xmlFilePath = xmlFilePath.replaceAll("\\\\", "/");// java中'\'是"\\"，正则表达式中'\'也是"\\"，所以是4条'\'
if (xmlFilePath.charAt(0) == '/')
xmlFilePath = xmlFilePath.replaceFirst("/", "");
doc = DocumentBuilderFactory.newInstance().newDocumentBuilder()
.parse(this.getClass().getClassLoader().getResource("") + xmlFilePath);
} /**
* 按照XML节点的标签名取得元素节点内第一个符合的值。用于唯一的标签
*
* @param tagName
*            XML节点的标签名
* @return XML元素节点内的值
*/
public String getValue(String tagName) {
return getValue(tagName, 0);
} /**
* 按照XML节点的标签名取得元素节点内的值
*
* @param tagName
*            XML节点的标签名
* @param index
*            标签名相同的节点之集合的索引。
* @return XML元素节点内的值
*/
public String getValue(String tagName, int index) {
return doc.getElementsByTagName(tagName).item(index).getFirstChild().getNodeValue();
}
}
DOM解析对我要处理的文本好像不大适用，老师给的文本标签属性都没有加引号，用这个方式运行时总是报错，手动将文件中标签对属性加入引号就不抱错了。
DOC>
<DOCID>XIN.19960211.0308</DOCID>
<HEADER>
<DATE>1996-02-11</DATE>
</HEADER>
<BODY>
<HEADLINE>
<S ID="12">
<MTS ID="1" TYPE="Entity" POSITION="Theme" LOCATION="Root" KEY="Complex" RTYPE="NotZ" USETIME="37">文字</MTS>\文字
</S>
</HEADLINE>
</BODY>
</DOC>
原文该部分标签属性没有引号；
关键是文本挺多的，都加引号的话手动不现实啊，能用别的方式处理文本不（获得标签属性信息）？
如：<MTS ID=1 TYPE=Entity POSITION=Theme LOCATION=Root  KEY=Complex RTYPE=NotZ USETIME=37>文字</MTS>
DOM解析对我要处理的文本好像不大适用，老师给的文本标签属性都没有加引号，用这个方式运行时总是报错，手动将文件中标签对属性加入引号就不抱错了。
DOC>
<DOCID>XIN.19960211.0308</DOCID>
<HEADER>
<DATE>1996-02-11</DATE>
</HEADER>
<BODY>
<HEADLINE>
<S ID="12">
<MTS ID="1" TYPE="Entity" POSITION="Theme" LOCATION="Root" KEY="Complex" RTYPE="NotZ" USETIME="37">文字</MTS>\文字
</S>
</HEADLINE>
</BODY>
</DOC>
原文该部分标签属性没有引号；
关键是文本挺多的，都加引号的话手动不现实啊，能用别的方式处理文本不（获得标签属性信息）？
如：<MTS ID=1 TYPE=Entity POSITION=Theme LOCATION=Root  KEY=Complex RTYPE=NotZ USETIME=37>文字</MTS>
public class Test{
public static void main(String[] args){
String content = "<HU>但随着日子的流逝，Wiley也越长越大，</HU>";
content = content.replaceAll("(?m)(?=</HU>)","常常静静的伴在小主人身边陪伴着。");
System.out.println(content);
}
}