请问如何获取网页中的数据表格里的内容以写入数据库?

  在网上看到有人说用分析网页源代码的方法，来分析字符串<table>,<tr>,<td>之类，但这不可行吧。
  因为网页里的表格跟数据库的表格不是同一概念，为了排版，网页也会用到表格标记的。
  这样做的话会得到很多不是我需要的表格的。
  我只需要获取就象数据库里的那种有列名的数据表格，也就是数据库里的关系模型的结构。

  如果用IHTMLTABLE接口的话，好象也会得到很多我不需要的表格。  不知道我表达的怎么样，大家听懂没有?  -___-

  请大侠们指教! ^_^