我现在想要抓取<p></p>之间的内容正则写的是@"<p>.*</p>" 但是<p></p>里面有微博的<a class="wt_article_link" onmouseover="WeiboCard.show(1627256245, 'ent' , this)" href="http://weibo.com/u/1627256245?zw=ent" target="_blank">[微博]</a>这段。我想把微博这段剔除掉不要请问应该怎么修改我的正则表达式  

解决方案 »

  1.   

    再来个Regex.Replace()就行了string html=@"<p>dfasfd<div>dads</div><a class=""wt_article_link"" onmouseover=""WeiboCard.show(1627256245, 'ent' , this)"" href=""http://weibo.com/u/1627256245?zw=ent"" target=""_blank"">[微博]</a></p>";
    string pattern=@"(?is)<a\s*class=""wt_article_link""[^>]*?>\[微博\]</a>";
    html=Regex.Replace(html,pattern,"");
      

  2.   


    不好意思1个的话用R额place是可以,但是我是网上抓取的内容事先并不知道weibo.com/u/1627256245?后面的这串数字到底是多少,我的思路是用正则直接过滤掉,而不是抓取下载再去查是多少再Replace掉,问下我这思路对么?
      

  3.   


    不好意思1个的话用R额place是可以,但是我是网上抓取的内容事先并不知道weibo.com/u/1627256245?后面的这串数字到底是多少,我的思路是用正则直接过滤掉,而不是抓取下载再去查是多少再Replace掉,问下我这思路对么?
    谢谢找你的方法我解决了微博的问题但是我正则表达式还是有点看不懂能问下么?
    (?is)表示什么  \s*表示什么   [^>]*?表示什么
    麻烦啦,本人菜鸟刚接触不久先谢谢大神啦