读取了一个html文件,想吧其中的某一些部分分割开来,举个例子说明:
字符串如下:
<td><div>你好123mjMJ & = - ? / <se>937,4*%^%^% </se>lkjlk</div>m<p>w.o? JKKMKKj & l中国df = tryt</p>ryj % l<div class=n>你不好</div>werjlkjl</td>
想吧“你好123mjMJ & = - ? / <se>937,4*%^%^% </se>lkjlk“,“你不好”从<div 与</div>的中间提取出来,放在一个数组里面,
请问哪位大虾知道,这样的正则表达式怎么表示?谢谢!
字符串如下:
<td><div>你好123mjMJ & = - ? / <se>937,4*%^%^% </se>lkjlk</div>m<p>w.o? JKKMKKj & l中国df = tryt</p>ryj % l<div class=n>你不好</div>werjlkjl</td>
想吧“你好123mjMJ & = - ? / <se>937,4*%^%^% </se>lkjlk“,“你不好”从<div 与</div>的中间提取出来,放在一个数组里面,
请问哪位大虾知道,这样的正则表达式怎么表示?谢谢!
//content = aRegex.Replace(content, "");
Regex htmlRegex = new Regex( @"<div[^>]*?>(?<content>[\s\S]*?)</div>", RegexOptions.IgnoreCase | RegexOptions.Compiled);
//content = htmlRegex.Replace(content, ""); MatchCollection mc = htmlRegex.Matches(content);
string[] div = new string[mc.Count];
for (int i=0; i<mc.Count; i++)
{
//int n = Int32.Parse(m.Groups["Content"].Value);
Console.WriteLine(mc[i].Groups["content"].Value);
div[i] = mc[i].Groups["content"].Value;
}