各位高手谁能帮我看看怎样从html的源码中,用正则表达式替出"<"">"之间的内容(包括这两个简括号),
有可能这两个简括号不在同一行上,怎么实现??? 急需谢谢!!!

解决方案 »

  1.   

    <tr style='mso-yfti-irow:54;height:10.0pt'>
      <td width=59 valign=top style='width:44.3pt;padding:0cm 0cm 0cm 0cm;
      height:10.0pt'>
      <p class=MsoNormal align=left style='margin-right:-1.0pt;text-align:left;
      line-height:10.0pt;mso-line-height-rule:exactly;mso-layout-grid-align:none;
      text-autospace:none'><span lang=EN-US style='font-size:9.5pt;font-family:
      "Arial Unicode MS";mso-hansi-font-family:"Times New Roman";mso-font-kerning:
      0pt'>3106132</span><span lang=EN-US style='font-size:12.0pt;mso-font-kerning:
      0pt'><o:p></o:p></span></p>
      </td>
    例如取出中间的3106132内容
      

  2.   

    <span[^>]*>([^<]*)</span>
    组1里
      

  3.   

    string strHtml = " 0pt'>3106132</span><";
            string strReg = @">(?<AAA>[^>]*)<";
            Regex r = new Regex(strReg);
            Match m = r.Match(strHtml);
            string strEnd = m.Groups["AAA"].Value.ToString();
            Response.Write(strEnd);
      

  4.   

    如果要匹配所有<>里的内容 
    用 : <.*?>
      

  5.   

    如果要求不高的话,petshop4(开始混正则了) 写得最好了.建议楼主试试看
    不过,要考虑到像
    <script>
    var string text = "a <= b; c => b";
    ....
    </script>
    这样的东西,就比较复杂了.会出现"<= b; c=>"这样奇怪的结果.
      

  6.   

    所以,楼主最好研究一下html解析器,html浏览器的处理方法