有一个xml文件,没有Schema和DTD,里面的数据没有格式化,所以人看的话基本不靠谱,
而且,这个xml有可能存在一些错误,比如
1.少了"<": name>james</name>
2.少了‘"’:<name nick="false>james</name>
3.少了开始或结束的标签:<name nick="false>james这只是举例说明,还有类似的错误。
这样一个不合法的xml文件,想sax,dom这样的解析器应该没法用了,
希望说,能够在一定程度上修正一些错误,然后格式化输出。我现在是想,要自己写个解析器了?利用状态机。
大家有什么想法,给点意见。