xml的语法修正和格式化输出

有一个xml文件，没有Schema和DTD，里面的数据没有格式化，所以人看的话基本不靠谱，
而且，这个xml有可能存在一些错误，比如
1.少了"<": name>james</name>
2.少了‘"’：<name nick="false>james</name>
3.少了开始或结束的标签：<name nick="false>james这只是举例说明，还有类似的错误。
这样一个不合法的xml文件，想sax，dom这样的解析器应该没法用了，
希望说，能够在一定程度上修正一些错误，然后格式化输出。我现在是想，要自己写个解析器了？利用状态机。
大家有什么想法，给点意见。