<tr> 
<td align="center" class=at9>02:00</td>
<td class=at9 width=80%><font color=ffffff><font color=2A5C8A>电视</font> 
<a target="_self" href="http://app.atmovies.com.tw/tv/attv.cfm?action=tvdata&tvtimeid=ECH73200703300200&year=2007&month=3&day=30&channel_id=CH73">
 <font class=at11>电视<font color=ffffff>X</font></font></a>T<font color=606060> </font>^H2</font>
</td>
<tr> 
    
<tr> 
<td align="center" class=at9>03:00</td>
<td class=at9 width=80%><font color=ffffff><font color=2A5C8A>电视节目</font> 
<a target="_self" href="http://app.atmovies.com.tw/tv/attv.cfm?action=tvdata&tvtimeid=ECH73200703300200&year=2007&month=3&day=30&channel_id=CH73">
 <font class=at11>电视台<font color=ffffff>X</font></font></a>T1<font color=606060> </font>^H22</font>
</td>
<tr> 要的是02:00 电视 电视  这些数据

解决方案 »

  1.   

    如果你的数据全部是这样的,字符串处理也可以的阿,删除字符串里面<>之间的字符串,开始不是<的放入数组,前3个数组的值就是你要的
      

  2.   

    试下string yourStr = richTextBox1.Text;MatchCollection mc = Regex.Matches(yourStr, @"<td[^>]*>(?<time>[^<]*?)</td>\s+<td[^>]*?>(?<content>[\s\S]*?)</td>", RegexOptions.IgnoreCase);
    foreach (Match m in mc)
    {
        richTextBox2.Text += m.Groups["time"].Value + "\n";    //时间
        richTextBox2.Text += Regex.Replace(m.Groups["content"].Value, @"<[^>]*?>", "")+"\n";   //内容
    }
      

  3.   

    string strHtml = "...";
    string ret = System.Text.RegularExpressions.Regex.Replace(strHtml,@"<.*?>"," ");
      

  4.   

    上面保留了格式,如果不想要回车,再处理一下就行了,空格也一样道理string yourStr = richTextBox1.Text;
    MatchCollection mc = Regex.Matches(yourStr, @"<td[^>]*>(?<time>[^<]*?)</td>\s+<td[^>]*?>(?<content>[\s\S]*?)</td>", RegexOptions.IgnoreCase);
    foreach (Match m in mc)
    {
        richTextBox2.Text += m.Groups["time"].Value + "\n";
        richTextBox2.Text += Regex.Replace(m.Groups["content"].Value, @"<[^>]*?>", "").Replace("\n","")+"\n";
    }
      

  5.   

    要匹配HTML标签的正则,网上流传的都是只能支持部分的,不够智能~
      

  6.   

    string strHtml = "...";
    string ret = System.Text.RegularExpressions.Regex.Replace(strHtml,@"<.*?>"," ");
      

  7.   

    string yourStr = richTextBox1.Text;
    MatchCollection mc = Regex.Matches(yourStr, @"<td[^>]*>(?<time>[^<]*?)</td>\s+<td[^>]*?>(?<content>[\s\S]*?)</td>", RegexOptions.IgnoreCase);
    foreach (Match m in mc)
    {
        richTextBox2.Text += m.Groups["time"].Value + "\n";
        richTextBox2.Text += Regex.Replace(m.Groups["content"].Value, @"<[^>]*?>", "").Replace("\n","")+"\n";
    }
      

  8.   

    <tr>\s*<[^>]+>.*?</td>\s*<td.*?8A>.*?</font>.*?<font[^>]>.*?<font.*?</td>\s*<tr>
      

  9.   

    at9>(\d\d:\d\d)[^\n]*\n.*?8A>(.*?)<\/font>\1 \2 就是楼主要提取的内容已经过楼主提供的示例html测试