例如,<HU>但随着日子的流逝,Wiley也越长越大,</HU>
插入文本内容:“ 常常静静的伴在小主人身边陪伴着。”
或者将<HU></HU>标签对中的文本信息读出来存到MySql数据库中;请大家给个思路吧,我也不知道标签对的位子信息用java可以怎么处理,一点思路都没有.

解决方案 »

  1.   

    这个是xml吧,用jdk里自带的w3c的DOM解析工具呀
    附一个用它读取xml文件中节点值的demo
    package servlet.demo.beans.util;import java.io.IOException;
    import javax.xml.parsers.*;
    import org.w3c.dom.Document;
    import org.xml.sax.SAXException;/**
     * XML读取器,用于按标签读取XML文件
     * 
     * @author HerveyHall
     *
     */
    public class XMLReader {
    private static Document doc; /**
     * 初始化一个XML读取器,并指定相对路径
     * 
     * @param xmlFilePath
     *            被读取的XML文件名
     * @throws ParserConfigurationException
     *             表示一个严重的配置错误。
     * @throws IOException
     *             输入/输出异常
     * @throws SAXException
     *             封装一般的SAX(simple API for XML,针对XML的简单API)错误或警告。
     */
    public XMLReader(String xmlFilePath) throws SAXException, IOException, ParserConfigurationException {
    xmlFilePath = xmlFilePath.replaceAll("\\\\", "/");// java中'\'是"\\",正则表达式中'\'也是"\\",所以是4条'\'
    if (xmlFilePath.charAt(0) == '/')
    xmlFilePath = xmlFilePath.replaceFirst("/", "");
    doc = DocumentBuilderFactory.newInstance().newDocumentBuilder()
    .parse(this.getClass().getClassLoader().getResource("") + xmlFilePath);
    } /**
     * 按照XML节点的标签名取得元素节点内第一个符合的值。用于唯一的标签
     * 
     * @param tagName
     *            XML节点的标签名
     * @return XML元素节点内的值
     */
    public String getValue(String tagName) {
    return getValue(tagName, 0);
    } /**
     * 按照XML节点的标签名取得元素节点内的值
     * 
     * @param tagName
     *            XML节点的标签名
     * @param index
     *            标签名相同的节点之集合的索引。
     * @return XML元素节点内的值
     */
    public String getValue(String tagName, int index) {
    return doc.getElementsByTagName(tagName).item(index).getFirstChild().getNodeValue();
    }
    }
      

  2.   

    DOM解析对我要处理的文本好像不大适用,老师给的文本标签属性都没有加引号,用这个方式运行时总是报错,手动将文件中标签对属性加入引号就不抱错了。
    DOC>
    <DOCID>XIN.19960211.0308</DOCID>
    <HEADER>
    <DATE>1996-02-11</DATE>
    </HEADER>
    <BODY>
    <HEADLINE>
    <S ID="12">
    <MTS ID="1" TYPE="Entity" POSITION="Theme" LOCATION="Root" KEY="Complex" RTYPE="NotZ" USETIME="37">文字</MTS>\文字
    </S>
    </HEADLINE>
    </BODY>
    </DOC>
    原文该部分标签属性没有引号;
    关键是文本挺多的,都加引号的话手动不现实啊,能用别的方式处理文本不(获得标签属性信息)?
    如:<MTS ID=1 TYPE=Entity POSITION=Theme LOCATION=Root  KEY=Complex RTYPE=NotZ USETIME=37>文字</MTS>
      

  3.   

    DOM解析对我要处理的文本好像不大适用,老师给的文本标签属性都没有加引号,用这个方式运行时总是报错,手动将文件中标签对属性加入引号就不抱错了。
    DOC>
    <DOCID>XIN.19960211.0308</DOCID>
    <HEADER>
    <DATE>1996-02-11</DATE>
    </HEADER>
    <BODY>
    <HEADLINE>
    <S ID="12">
    <MTS ID="1" TYPE="Entity" POSITION="Theme" LOCATION="Root" KEY="Complex" RTYPE="NotZ" USETIME="37">文字</MTS>\文字
    </S>
    </HEADLINE>
    </BODY>
    </DOC>
    原文该部分标签属性没有引号;
    关键是文本挺多的,都加引号的话手动不现实啊,能用别的方式处理文本不(获得标签属性信息)?
    如:<MTS ID=1 TYPE=Entity POSITION=Theme LOCATION=Root  KEY=Complex RTYPE=NotZ USETIME=37>文字</MTS>
      

  4.   


    public class Test{
    public static void main(String[] args){
    String content = "<HU>但随着日子的流逝,Wiley也越长越大,</HU>";
    content = content.replaceAll("(?m)(?=</HU>)","常常静静的伴在小主人身边陪伴着。");
    System.out.println(content);
    }
    }