有一个HTML页面,希望通过正则表达式实现如下功能:获取仅由标点、汉字、数字及<br>组成的连续内容。
求该正则表达式!!!!!!
谢谢了。

解决方案 »

  1.   

    标点指哪些,自己填到0-9后面就是了(?i)([\u4e00-\u9fa50-9]|<br>)+
      

  2.   

    获取仅由标点、汉字、数字及<br>组成的连续内容是连续内容。。
      

  3.   

    就是匹配仅由 标点、汉字、数字及<br>组成的连续内容
      

  4.   

    (?i)([\u4e00-\u9fa50-9,\.;\?\+\-]|<br>)+
    楼主  过客让你提供实例   他是我在CSDN中见的正则用的最好的一个
      

  5.   

    比如string test = @"有一个HTML页面,希望通过正则表达式实现如下功能:
    获取仅由标点、汉字、数字及<br>组成的连续内容。";
    Regex reg = new Regex(@"(?i)([\u4e00-\u9fa50-9、。,:,.:]|<br>)+");
    MatchCollection mc = reg.Matches(test);
    foreach (Match m in mc)
    {
        richTextBox2.Text += m.Value + "\n";
    }
    /*------输出-------
    有一个
    页面,希望通过正则表达式实现如下功能:
    获取仅由标点、汉字、数字及<br>组成的连续内容。
    */
      

  6.   

    居然还有这种需求Regex reg = new Regex(@"(?in)(?!(<br>)+(<|$))(?<=>|^|&nbsp)((?!&nbsp)[^<>]|<br>)+(?=&nbsp|<|$)");
    MatchCollection mc = reg.Matches(yourStr);
    foreach(Match m in mc)
    {
        richTextBox2.Text += m.Value + "\n----------------------\n";
    }