以前我对于把XML文件中的数据转移到数据库中,一直是采用DataSet的readxml方法先把xml文件读到DataSet中,再通过DataSet的update或循环来完成数据转移,但是一但数据量变大后,感觉用这种方法的效率并不是很高。所以产生了想自己解析XML文件的节点数据,再插入到数据库中取,但是现在能解吸XML数据的方法也很多比如象xmlreader,XmlTextReader,XmlDocument等等都可以,我就选了XmlTextReader进行初步的解析,但感觉用XmlTextReader是对XML文件中逐个节点进行解析那样虽然也能解析,但对于解析的速度比DataSet好象更慢。因此我想请教一下有这方面经验的朋友,有没有其他的方法能更好的进行数据的转移,谢谢!。我的XML文件的格式基本如下
<ds>
    <book>
       <a1>1111<a1>
       <b1>1111<b1>
    </book>
    <school>
       <s1>1111<s1>
       <h1>1111<h1>
    </school>
    <Data>
          <d1>111</d1>
          <d2>111</d2>
          .
          .
          .
    </Data>
    <Data>
          <d1>111</d1>
          <d2>111</d2>
          .
          .
          .
    </Data>
    //数据主要放在Data中,因此会有大量的Data    
<ds>

解决方案 »

  1.   

    根据我个人经验,直接用XmlDocument最快(前提是你比较了解Document对象),我自己整理一些查询操作如下,希望对你有些作用:2 XML 数据的查询 
      最常见的XML数据类型有:Element, Attribute,Comment, Text. 
      Element, 指形如<Name>Tom<Name>的节点。它可以包括:Element, Text, Comment, ProcessingInstruction, CDATA, and EntityReference. 
      Attribute, 指在<Employee id=”12345”>中的粗体部分。 
      Comment,指形如:<!-- my comment --> 的节点。 
      Text,指在<Name>Tom<Name>的粗体部分。 
      在XML中,可以用XmlNode对象来参照各种XML数据类型。 
      2.1 查询已知绝对路径的节点(集) 
      objNodeList = objDoc.SelectNodes(“Company/Department/Employees/Employee”) 
      或者 
      objNodeList = objNode.SelectNodes(“/Company/Department/Employees/Employee”) 
      以上两种方法可返回一个NodeList对象,如果要返回单个节点可使用SelectSingleNode方法,该方法如果查询到一个或多个节点,返回第一个节点;如果没有查询的任何节点返回 Nothing。例如: 
      objNode = objNode.SelectSingleNode(“/Company/Department/Employees/Employee”) 
      If Not (objNode is Nothing) then 
       ‘- Do process 
      End If 
      2.2 查询已知相对路径的节点(集) 
      可使用类似于文件路径的相对路径的方式来查询XML的数据 
      objNode = objDoc.SelectSingleNode(“Company/Department”) 
      objNodeList = objNode.SelectNodes(“../Department) 
      objNode = objNode.SelectNode(“Employees/Employee”) 
      2.3 查询已知元素名的节点(集) 
      在使用不规则的层次文档时,由于不知道中间层次的元素名,可使用//符号来越过中间的节点,查询其子,孙或多层次下的其他所有元素。例如: 
      objNodeList = objDoc.SelectNodes(“Company//Employee”) 
      2.4 查询属性(attribute)节点 
      以上的各种方法都返回元素(element)节点(集),返回属性(attribute),只需要采用相应的方法,在属性名前加一个@符号即可,例如: 
      objNodeList = objDoc.SelectNodes(“Company/Department/Employees/Employee/@id”) 
      objNodeList = objDoc.SelectNodes(“Company//@id”) 
      2.5 查询Text节点 
      使用text()来获取Text节点。 
      objNode= bjDoc.SelectSingleNode(“Company/Department/Deparmt_Name/text()”) 
      2.6 查询特定条件的节点 
      使用[]符号来查询特定条件的节点。例如: 
      a. 返回id号为 10102的Employee节点 
       objNode = objDoc.SelectSingleNode(“Company/Department/Employees/Employee[@id=’10102’]”) 
      b. 返回Name为Zhang Qi的Name 节点 
       objNode = objDoc.SelectSingleNode(“Company/Department/Employees/Employee/Name[text()=’Zhang Qi’]”) 
      c. 返回部门含有职员22345的部门名称节点 
      objNode = objDoc.SelectSingleNode("Company/Department[Employees/Employee/@id='22345']/Department_Name") 
      2.7 查询多重模式的节点 
      使用 | 符号可以获得多重模式的节点。例如: 
      objNodeList = objDoc.SelectNodes(“Company/Department/Department_Name | Company/Department/Manager”) 
      2.8 查询任意子节点 
      使用*符号可以返回当前节点的所有子节点。 
      objNodeList = objDoc.SelectNodes(“Company/*/Manager) 
      或者 
      objNodeList = objNode.ChildNodes
      

  2.   

    示例数据:
     
    <?xml version="1.0" encoding="UTF-8"?> 
      <Company> 
        <Department id="101"> 
        <Department_Name>Cai WuBu</Department_Name> 
        <Manager>Zhang Bin</Manager> 
        <Employees> 
        <Employee id="12345"> 
        <Employee_ID>12345</Employee_ID> 
        <Name>Zhang Bin</Name> 
        <Gender>male</Gender> 
        /Employee> 
        <Employee id="10101"> 
        <Employee_ID>10101</Employee_ID> 
        <Name>Zhang QI</Name> 
        <Gender>female</Gender> 
        </Employee> 
        <Employee id="10102"> 
        <Employee_ID>10102</Employee_ID> 
         <Name>Zhang Xia</Name> 
        <Gender>male</Gender> 
        </Employee> 
        <Employee id="10201"> 
        <Employee_ID>10201</Employee_ID> 
        <Name>ZhangChuang</Name> 
        <Gender>male</Gender> 
        </Employee> 
        <Employee id="10202"> 
        <Employee_ID>10202</Employee_ID> 
        <Name>Zhang Jun</Name> 
        <Gender>male</Gender> 
        </Employee> 
        </Employees> 
        </Department> 
        <Department id="102"> 
        <Department_Name>KaiFa Bu</Department_Name> 
        <Manager>Wang Bin</Manager> 
        <Employees> 
        <Employee id="22345"> 
        <Employee_ID>22345</Employee_ID> 
        <Name>Wang Bin</Name> 
        <Gender>male</Gender> 
        </Employee> 
        <Employee id="20101"> 
        <Employee_ID>20101</Employee_ID> 
        <Name>Wang QI</Name> 
        <Gender>female</Gender> 
        </Employee> 
        <Employee id="20102"> 
        <Employee_ID>20102</Employee_ID> 
        <Name>Wang Xia</Name> 
        <Gender>male</Gender> 
        </Employee> 
        <Employee id="20201"> 
        <Employee_ID>20201</Employee_ID> 
        <Name>Wang Chuang</Name> 
        <Gender>male</Gender> 
        </Employee> 
        <Employee id="20202"> 
        <Employee_ID>20201</Employee_ID> 
        <Name>Wang Jun</Name> 
        <Gender>male</Gender> 
        </Employee> 
        </Employees> 
        </Department> 
      </Company>