在html中用正则表达式提取table块的问题,很很很急用,请助我解决。已经没分了。谢谢。在一篇html文档中,包括一个table表格(暂时叫母表),在这个table表格中,有两个子table表格。分别以这两个子table表格中的[abcdefg]和[1234567890]这两个单元格为标记,将这个table表格(母表)从这篇html中提取出来。我用:<table[^>]*>[^>]*<tr>[\s\S].*?\[abcdefg\][\s\S]*?\[1234567890\][\s\S]*?</tr>[^>]*</table>,只能提取其中的一部分,而不能提取整个表格。以下只列出了我需要提取的部分。……省略了前面的html
<table border="1" width="100%" cellpadding="2" style="border-collapse: collapse">
<tr>
<td bgcolor="#ECECEC" height="24">
<table border="1" width="100%" cellpadding="2" style="border-collapse: collapse">
<tr>
<td>[abcdefg]</td>
<td>测试单元格</td>
</tr>
</table>
</td>
</tr>
<tr>
<td>
<table border="1" width="100%" cellpadding="0" style="border-collapse: collapse" cellspacing="0">
<tr>
<td>[1234567890]</td>
<td>[123456789x]</td>
</tr>
<tr>
<td>[123456789y]</td>
<td>[1234567890]</td>
</tr>
</table>
</td>
</tr>
<tr>
<td bgcolor="#FAFAFA">底部单元格</td>
</tr>
</table>
……省略了后面的html