在网上获取到的字符串为 <table><tr><th>姓名</th><th>身高</th><th>年纪</th><th>学历</th> </tr><tr><td>张三</td><td>198厘米</td><td>25</td> <td>小学</td></tr><tr><td>李四</td><td>178厘米</td><td>18</td><td>大学</td></tr></table>用正则表达式得出以下结果序号:1
姓名:张四
身高:198厘米
年纪:25
学历:小学序号:2
姓名:李四
身高:178厘米
年纪:18
学历:大学
...
姓名:张四
身高:198厘米
年纪:25
学历:小学序号:2
姓名:李四
身高:178厘米
年纪:18
学历:大学
...
StreamReader reader = new StreamReader("c:\\1.txt",Encoding.Default);
string source = reader.ReadToEnd();
Regex reg = new Regex(@"(?is)(?<=<td>).*?(?=</td>)");
MatchCollection mc = reg.Matches(source);
foreach (Match m in mc)
{
MessageBox.Show(m.Groups["value"].Value);
}
上面正则取到
/*
张三
198
厘米
25
小学
李四
178
厘米
18
大学
*/把他们处理一下就行
Regex reg = new Regex(@"(?i)<tr>\s*<td>([^<]*)</td>\s*<td>([^<]*)</td>\s*<td>([^<]*)</td>\s*<td>([^<]*)</td>\s*</tr>");
MatchCollection mc = reg.Matches(yourStr);
foreach (Match m in mc)
{
richTextBox2.Text += "姓名:" + m.Groups[1].Value + "\n";
richTextBox2.Text += "身高:" + m.Groups[2].Value + "\n";
richTextBox2.Text += "年纪:" + m.Groups[3].Value + "\n";
richTextBox2.Text += "学历:" + m.Groups[4].Value + "\n---------------\n";
}
/*-----输出-----
姓名:张三
身高:198厘米
年纪:25
学历:小学
---------------
姓名:李四
身高:178厘米
年纪:18
学历:大学
---------------
*/
首先,通过(?i)<th>(.*?)</th>获取姓名、身高等,
然后,通过(?i)<tr>\s*<td>([^<]*)</td>\s*<td>([^<]*)</td>\s*<td>([^<]*)</td>\s*<td>([^<]*)</td>\s*</tr>获取相应的数据Regex reg1 = new Regex(@"(?i)<th>(.*?)</th>");
Regex reg2 = new Regex(@"(?i)<tr>\s*<td>([^<]*)</td>\s*<td>([^<]*)</td>\s*<td>([^<]*)</td>\s*<td>([^<]*)</td>\s*</tr>");
List<string> listTitle=new List<string>();
Dictionary<string,string> dicValue=new Dictionary<string,string>();
MatchCollection mc1 = reg1.Matches(yourStr);
foreach (Match m in mc1)
{
listTitle.Add(m.Groups[1].Value);
}
int i=0;
MatchCollection mc2 = reg2.Matches(yourStr);
foreach (Match m in mc2&&i<mc2.Count)
{
dicValue.Add(list[i],m.Groups[i].Value);
i++;
}
<tr>
<th>姓名</th><th>身高</th><th>年纪</th><th>学历</th> </tr><tr>
<td>张三</td>
<td>198厘米</td>
<td width="20">25</td>
<td width="20">小学</td></tr>
<tr>
<td>李四</td>
<td>178厘米</td>
<td width="20">18</td>
<td width="20">大学</td>
</tr>
</table>如果我只想要这样的结果呢张三:25
李四:18
...PS:<td width="20"> 这样匹配把学历也遍历进来了另外我要这样才能获取到值
m.Groups.SyncRoot.ToString();
m.Groups["value"].Value 这个不行
<table>
<tr>
<th>姓名</th><th>身高</th><th>年纪</th><th>学历</th> </tr><tr>
<td>张三</td>
<td>198厘米</td>
<td width=""20"">25</td>
<td width=""20"">小学</td></tr>
<tr>
<td>李四</td>
<td>178厘米</td>
<td width=""20"">18</td>
<td width=""20"">大学</td>
</tr>
</table>";
Regex reg = new Regex(@"(?is)<tr>\s*<td>(.*?)</td>\s*<td>.*?</td>\s*<td[^>]*?>(.*?)</td>.*?</tr>");
foreach (Match m in reg.Matches(str))
Console.WriteLine("{0}:{1}", m.Groups[1].Value, m.Groups[2].Value);