想通过正则表达式提取<td></td>之间的文本(包含<td></td>),但不知道该如何处理嵌套标签的情况。
如下代码,我只想取里面的两个<td></td>,但实际结果是
<td><tr><td>key sentence1</td> 和 <td>key sentence2</td>
<tr>
<td>
<tr>
<td>
key sentence1
</td>
<td>
key sentence2
</td>
</tr>
</td>
</tr>