如题,写一个获取字符串中<table></table>中标记的内容
以 <table cellpadding="0" cellspacing="0" id="1" 开始 /table>结束,其中id为1到10例如:
<table cellpadding="0" cellspacing="0" id="1" mu="http://video.baidu.com/v?ct=301989888&rn=20&pn=0&db=0&s=8&word=%BA%EC%C2%A5%C3%CE&fr=ala0"><tr><td class="f"><a onclick="c({'fm':'alvd','title':this.innerHTML,'url':this.href,'p1':al_c(this)});"  target="_blank" href="http://video.baidu.com/v?ct=301989888&rn=20&pn=0&db=0&s=8&word=%BA%EC%C2%A5%C3%CE&fr=ala0" ><font size="3"><em>红楼梦</em> 专辑(1~36集全)_百度视频</font></a><br/><font size="-1">约有43个<em>红楼梦</em>相关的视频 <em>红楼梦</em> 第1集 <em>红楼梦</em> 第2集 <em>红楼梦</em> 第3集 <em>红楼梦</em> 第4集 <em>红楼梦</em> 第5集 <em>红楼梦</em> 第6集 <em>红楼梦</em> 第7集 <em>红楼梦</em> 第8集 <em>红楼梦</em> 第9...<br/>分集:<a onclick="c({'fm':'alvd','title':this.innerHTML,'url':this.href,'p1':al_c(this),'p2':1});"  target="_blank" href="http://video.baidu.com/v?ct=301989888&s=8&word=%BA%EC%C2%A5%C3%CE%201&fr=ala1">第1集</a>&nbsp;&nbsp;&nbsp;&nbsp;<a onclick="c({'fm':'alvd','title':this.innerHTML,'url':this.href,'p1':al_c(this),'p2':2});"  target="_blank" href="http://video.baidu.com/v?ct=301989888&s=8&word=%BA%EC%C2%A5%C3%CE%202&fr=ala2">第2集</a>&nbsp;&nbsp;&nbsp;&nbsp;<a onclick="c({'fm':'alvd','title':this.innerHTML,'url':this.href,'p1':al_c(this),'p2':3});"  target="_blank" href="http://video.baidu.com/v?ct=301989888&s=8&word=%BA%EC%C2%A5%C3%CE%203&fr=ala3">第3集</a>&nbsp;&nbsp;...&nbsp;&nbsp;<a onclick="c({'fm':'alvd','title':this.innerHTML,'url':this.href,'p1':al_c(this),'p2':5});"  target="_blank" href="http://video.baidu.com/v?ct=301989888&s=8&word=%BA%EC%C2%A5%C3%CE%2035&fr=ala4">第35集</a>&nbsp;&nbsp;&nbsp;&nbsp;<a onclick="c({'fm':'alvd','title':this.innerHTML,'url':this.href,'p1':al_c(this),'p2':6});"  target="_blank" href="http://video.baidu.com/v?ct=301989888&s=8&word=%BA%EC%C2%A5%C3%CE%2036&fr=ala5">第36集(大结局)</a>&nbsp;&nbsp;<br /><font color="#008000">video.baidu.com/v?word=红楼梦 2010-6-6</font><br/></font></td></tr></table>想去的其中所有标记的内容,有朋友说用正则表达式,请指明!

解决方案 »

  1.   

    过滤HTML
    Regex.Replace(html, "<[^>]+>", "");
      

  2.   

    try...Regex reg = new Regex(@"(?is)<table cellpadding=""0"" cellspacing=""0"" id=""([1-9]|10)""[^>]*>(?:(?!</?table\b).)*</table>");
    MatchCollection mc = reg.Matches(yourStr);
    foreach (Match m in mc)
    {
        richTextBox2.Text += m.Value + "\n";
    }
      

  3.   

    Regex.Match(html,@"(?is)<table[^>]*>((?!<table[^>]*>).+?)</table>")
      

  4.   

    Regex.Match(html,@"(?is)<table[^>]*>((?!<table[^>]*>).+?)</table>")
      

  5.   

    问题补充一下,2楼的方法我试了,但是还有的table有border="0",在匹配时就被删掉了。
    但是我希望保留下来