网页里面有很多div,只想取class=nav2中的内容:
比如:<div class="nav1">
<span><a href=node_1.htm>1</a></span>
</div>
<div class="nav2">
<span><a href=node_2.htm>2</a></span>
</div>我只想要的结果是:2,或者<span><a href=node_2.htm>2</a></span>也行,最后两种结果正则都贴出来。
比如:<div class="nav1">
<span><a href=node_1.htm>1</a></span>
</div>
<div class="nav2">
<span><a href=node_2.htm>2</a></span>
</div>我只想要的结果是:2,或者<span><a href=node_2.htm>2</a></span>也行,最后两种结果正则都贴出来。
得到纯文本的话,把上边正则得到的结果Regex.Replace(result,@"<.+?>","")就是了
(?is)(?<=<div[^>]*?(?:class)="nav2"[^>]*>).*?(?=</div>)