读取了一个html文件,想吧其中的某一些部分分割开来,举个例子说明:
字符串如下:
<td><div>你好123mjMJ & = - ? / <se>937,4*%^%^% </se>lkjlk</div>m<p>w.o? JKKMKKj & l中国df = tryt</p>ryj % l<div class=n>你不好</div>werjlkjl</td>
想吧“你好123mjMJ & = - ? / <se>937,4*%^%^% </se>lkjlk“,“你不好”从<div 与</div>的中间提取出来,放在一个数组里面,
请问哪位大虾知道,这样的正则表达式怎么表示?谢谢!

解决方案 »

  1.   

    <div[^>]*?>[\s\S]*?</div>
      

  2.   

    string content = @"<td><div>你好123mjMJ & = - ? / <se>937,4*%^%^% </se>lkjlk</div>m<p>w.o? JKKMKKj & l中国df = tryt</p>ryj % l<div class=n>你不好</div>werjlkjl</td>";
    //content = aRegex.Replace(content, "");
    Regex htmlRegex = new Regex( @"<div[^>]*?>(?<content>[\s\S]*?)</div>", RegexOptions.IgnoreCase | RegexOptions.Compiled);
    //content = htmlRegex.Replace(content, ""); MatchCollection mc = htmlRegex.Matches(content);
    string[] div = new string[mc.Count];
    for (int i=0; i<mc.Count; i++)
    {
    //int n = Int32.Parse(m.Groups["Content"].Value);
    Console.WriteLine(mc[i].Groups["content"].Value);
    div[i] = mc[i].Groups["content"].Value;
    }