有一个xml文件,没有Schema和DTD,里面的数据没有格式化,所以人看的话基本不靠谱,
而且,这个xml有可能存在一些错误,比如
1.少了"<": name>james</name>
2.少了‘"’:<name nick="false>james</name>
3.少了开始或结束的标签:<name nick="false>james这只是举例说明,还有类似的错误。
这样一个不合法的xml文件,想sax,dom这样的解析器应该没法用了,
希望说,能够在一定程度上修正一些错误,然后格式化输出。我现在是想,要自己写个解析器了?利用状态机。
大家有什么想法,给点意见。
而且,这个xml有可能存在一些错误,比如
1.少了"<": name>james</name>
2.少了‘"’:<name nick="false>james</name>
3.少了开始或结束的标签:<name nick="false>james这只是举例说明,还有类似的错误。
这样一个不合法的xml文件,想sax,dom这样的解析器应该没法用了,
希望说,能够在一定程度上修正一些错误,然后格式化输出。我现在是想,要自己写个解析器了?利用状态机。
大家有什么想法,给点意见。
StAX 仍然保留了 SAX 相对于 DOM 的优点。通过把重心从结果对象模型转移到解析流本身,从理论上说应用程序能够处理无限的 XML 流