假设有如下一段代码:
<div class="article">
这是无用内容
<b>这是无用内容</b>
  这是有效文本
<img src=“a.jpg”/>
这是有效文本
<img src=“b.jpg”/>
这是有效文本
<img src=“c.jpg”/>
</div>
想用HtmlParser把所有有效文本都提取出来,不想一个一个慢慢提取,因为文本和IMG标签重复次数不确定。有智能一点的办法吗?多谢~~
可不可以定义提取</b>和</div>之间的内容··