我的数据是通过网页查询Oracle数据库得到的HTML表格,已通过ie.Document.documentElement.innerHTML和正则表达式统一格式,每个文件有几百上千条,共几千个文件,请问有没有简单的方法把他们快速的导入数据库?Oracle、Ms SQL Server、MySQl等数据库哪个能直接导入这样的HTML文件?HTML源代码如下:<HEAD><TITLE>xxxxxxxxxxxxxxx</TITLE>
<STYLE>
.WB {   border-top:1px solid rgb(2,3,2) ; border-left:1px solid rgb(2,3,2); }</STYLE><META content="Microsoft Visual InterDev 1.0" name=GENERATOR>
<META http-equiv=Content-Type content="text/html; charset=gb_2312-80"></HEAD>
<BODY text=green>
<P>
<CENTER>xxxxxxxxxxxxxxx</CENTER>
<P>
<DIV align=center>
<TABLE cellSpacing=10 cellPadding=0 width="800%" border=0>
<TBODY></TBODY></TABLE>
<TABLE style="BORDER-RIGHT: rgb(2,3,2) 2px solid; BORDER-TOP: rgb(2,3,2) 1px solid; BORDER-LEFT: rgb(2,3,2) 1px solid; BORDER-BOTTOM: rgb(2,3,2) 2px solid" cellSpacing=0 cellPadding=0>
<TBODY>
<TR>
<TD style="BORDER-TOP: rgb(0,0,0) 1px solid; BORDER-LEFT: rgb(0,0,0) 1px solid" noWrap>字段1</TD>
<TD style="BORDER-TOP: rgb(0,0,0) 1px solid; BORDER-LEFT: rgb(0,0,0) 1px solid" noWrap>字段2</TD>
<TD style="BORDER-TOP: rgb(0,0,0) 1px solid; BORDER-LEFT: rgb(0,0,0) 1px solid" noWrap>字段3</TD>
<TD style="BORDER-TOP: rgb(0,0,0) 1px solid; BORDER-LEFT: rgb(0,0,0) 1px solid" noWrap>字段4</TD>
<TD style="BORDER-TOP: rgb(0,0,0) 1px solid; BORDER-LEFT: rgb(0,0,0) 1px solid" noWrap>字段5</TD></TR>
<TR>
<TD class=wb>a1F1</TD>
<TD class=wb>a1F2</TD>
<TD class=wb>a1F3</TD>
<TD class=wb>a1F4</TD>
<TD class=wb>备注1</TD></TR>
<TR>
<TD class=wb>a2F1</TD>
<TD class=wb>a2F2</TD>
<TD class=wb>a2F3</TD>
<TD class=wb>a2F4</TD>
<TD class=wb>备注2</TD></TR>
<TR>
......
</TR></TBODY></TABLE>
<P>&nbsp;</P></DIV></BODY>

解决方案 »

  1.   

    可以用下列方法导入一个文件的数据:
    LOAD DATA LOCAL INFILE 20000103.htm'
        INTO TABLE table_daydata
        CHARACTER SET gb2312    FIELDS
            TERMINATED BY '</TD>\r\n<TD class=wb>'    LINES
            STARTING BY '<TR>\r\n<TD class=wb>'
            TERMINATED BY '</TD></TR>\r\n'
        ;但是又有新的问题:如何将<TD class=wb>&nbsp;</TD>中的&nbsp;以NULL值导入数据库?