想通过正则表达式提取<td></td>之间的文本(包含<td></td>),但不知道该如何处理嵌套标签的情况。
如下代码,我只想取里面的两个<td></td>,但实际结果是
<td><tr><td>key sentence1</td> 和 <td>key sentence2</td>
<tr>
<td>
<tr>
<td>
key sentence1
</td>
<td>
key sentence2
</td>
</tr>
</td>
</tr>
如下代码,我只想取里面的两个<td></td>,但实际结果是
<td><tr><td>key sentence1</td> 和 <td>key sentence2</td>
<tr>
<td>
<tr>
<td>
key sentence1
</td>
<td>
key sentence2
</td>
</tr>
</td>
</tr>
MatchCollection mc = reg.Matches(yourStr);
foreach (Match m in mc)
{
richTextBox2.Text += m.Value + "\n-----------------------\n";
}