去截取XML是比较困难的,你可以用其他的XML分析器。对于数据有一个基本的分析,要处理的是大量的还是少量的,再根据不同的要求选取不同的分析器。
http://www.sosnoski.com/opensrc/xmlbench/results.html

解决方案 »

  1.   

    遍历xml我想应该sax2已经是最快的了
      

  2.   

    起1000到1050 这50 个我是做到了,但如何跳出
    sax2的寻环啊????
      

  3.   

    我想当一个XML文件大到10M的时候,通常是一种Data-Centric的应用了,所以在这种情况下,由文件系统+plain text file的方式来存储数据是不合适的。这种时候需要的是一种XML Database,XML格式的数据以一种方便高效检索的格式存放其中,用户可以通过Xpath or XQuery来进行很灵活的查询。
      

  4.   

    我想sax之所以是简单接口,就因为是流的方式处理,而不象dom那样能随意访问文档的任何部分。估计是不能从中截取的