<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>无标题文档</title>
</head><body>
<li>
<div class="info comet-m">
<div class="avatar s60 J_PigCard" param:user_id="100727373">
<a href="http://bangpai.test.com/user/groups/100727373.htm" title="测试1" class="pic s60">
<img src="http://img08.testcdn.com/sns_logo/i8/T1UZ8rXlNHXXaH.X6X_60x60.jpg"/>
</a>
<span>更多</span>
</div>
<div class="name"><a href="http://bangpai.test.com/user/groups/100727373.htm">测试1</a></div>
<ul class="attr">
<li class="position">编修</li>
</ul>
<p class="time">2010-06-17 加入</p>
</div>
</li>
<li>
<div class="info comet-m">
<div class="avatar s60 J_PigCard" param:user_id="100727373">
<a href="http://bangpai.test.com/user/groups/100727373.htm" title="测试2" class="pic s60">
<img src="http://img08.testcdn.com/sns_logo/i8/T1UZ8rXlNHXXaH.X6X_60x60.jpg"/>
</a>
<span>更多</span>
</div>
<div class="name"><a href="http://bangpai.test.com/user/groups/100727373.htm">测试2</a></div>
<ul class="attr">
<li class="position">编修</li>
</ul>
<p class="time">2010-06-17 加入</p>
</div>
</li>
</body>
</html>
上面的网页里面显示的是一些用户的信息,其中每一个<li></li>是一个用户的信息,其中包含:
1、<div class="avatar s60 J_PigCard" param:user_id="100727373">
其中包含的user_id="100727373",我需要提取user_id
2、<div class="name"><a href="http://bangpai.test.com/user/groups/100727373.htm">测试2</a></div>
其中包含的用户名"测试2";
3、<p class="time">2010-06-17 加入</p>
其中包含用户加入的时间。
求高手告知提取这三项信息的正则表达式!
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>无标题文档</title>
</head><body>
<li>
<div class="info comet-m">
<div class="avatar s60 J_PigCard" param:user_id="100727373">
<a href="http://bangpai.test.com/user/groups/100727373.htm" title="测试1" class="pic s60">
<img src="http://img08.testcdn.com/sns_logo/i8/T1UZ8rXlNHXXaH.X6X_60x60.jpg"/>
</a>
<span>更多</span>
</div>
<div class="name"><a href="http://bangpai.test.com/user/groups/100727373.htm">测试1</a></div>
<ul class="attr">
<li class="position">编修</li>
</ul>
<p class="time">2010-06-17 加入</p>
</div>
</li>
<li>
<div class="info comet-m">
<div class="avatar s60 J_PigCard" param:user_id="100727373">
<a href="http://bangpai.test.com/user/groups/100727373.htm" title="测试2" class="pic s60">
<img src="http://img08.testcdn.com/sns_logo/i8/T1UZ8rXlNHXXaH.X6X_60x60.jpg"/>
</a>
<span>更多</span>
</div>
<div class="name"><a href="http://bangpai.test.com/user/groups/100727373.htm">测试2</a></div>
<ul class="attr">
<li class="position">编修</li>
</ul>
<p class="time">2010-06-17 加入</p>
</div>
</li>
</body>
</html>
上面的网页里面显示的是一些用户的信息,其中每一个<li></li>是一个用户的信息,其中包含:
1、<div class="avatar s60 J_PigCard" param:user_id="100727373">
其中包含的user_id="100727373",我需要提取user_id
2、<div class="name"><a href="http://bangpai.test.com/user/groups/100727373.htm">测试2</a></div>
其中包含的用户名"测试2";
3、<p class="time">2010-06-17 加入</p>
其中包含用户加入的时间。
求高手告知提取这三项信息的正则表达式!
用匹配子项就可以了
其中reg.MatchedExpression=reg.SubExpressions[0]
以下为匹配子项 依次为ID、用户名、加入时间
ShowMessage(reg.SubExpressions[1]);
ShowMessage(reg.SubExpressions[2]);
ShowMessage(reg.SubExpressions[3]);非常感谢zswang