<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>无标题文档</title>
</head><body>
<li>
<div class="info comet-m">
<div class="avatar s60 J_PigCard" param:user_id="100727373">
<a href="http://bangpai.test.com/user/groups/100727373.htm" title="测试1" class="pic s60">
<img src="http://img08.testcdn.com/sns_logo/i8/T1UZ8rXlNHXXaH.X6X_60x60.jpg"/>
</a>
<span>更多</span>
</div>
<div class="name"><a href="http://bangpai.test.com/user/groups/100727373.htm">测试1</a></div>
<ul class="attr">
<li class="position">编修</li>
</ul>
<p class="time">2010-06-17 加入</p>
</div>
</li>
                                
                                 <li>
<div class="info comet-m">
<div class="avatar s60 J_PigCard" param:user_id="100727373">
<a href="http://bangpai.test.com/user/groups/100727373.htm" title="测试2" class="pic s60">
<img src="http://img08.testcdn.com/sns_logo/i8/T1UZ8rXlNHXXaH.X6X_60x60.jpg"/>
</a>
<span>更多</span>
</div>
<div class="name"><a href="http://bangpai.test.com/user/groups/100727373.htm">测试2</a></div>
<ul class="attr">
<li class="position">编修</li>
</ul>
<p class="time">2010-06-17 加入</p>
</div>
</li>
</body>
</html>
上面的网页里面显示的是一些用户的信息,其中每一个<li></li>是一个用户的信息,其中包含:
1、<div class="avatar s60 J_PigCard" param:user_id="100727373">
其中包含的user_id="100727373",我需要提取user_id
2、<div class="name"><a href="http://bangpai.test.com/user/groups/100727373.htm">测试2</a></div>
其中包含的用户名"测试2";
3、<p class="time">2010-06-17 加入</p>
其中包含用户加入的时间。
求高手告知提取这三项信息的正则表达式!

解决方案 »

  1.   

    /<div\s+[^>]*\bparam:user_id="(\d+)">[\s\S]*?<div class="name"><a\b[^>]*>(.*?)<\/a><\/div>[\s\S]*?<p class="time">(.*?)<\/p>/
      

  2.   

    高手看了您给的正则表达式,太感谢了。还有一个问题想问下:你给的字符串可以匹配出所有符合条件的串 ,但是怎么从匹配的一串字符串再取出我要的三个值呢。我试着用循环去替换取我要的三个值,但是发现那样太繁琐,而且循环太多了。有劳了呵呵 我是用DELPHI正则表达式
      

  3.   

    呵呵 自己找到方法了
    用匹配子项就可以了
    其中reg.MatchedExpression=reg.SubExpressions[0]
    以下为匹配子项 依次为ID、用户名、加入时间
        ShowMessage(reg.SubExpressions[1]);
          ShowMessage(reg.SubExpressions[2]);
            ShowMessage(reg.SubExpressions[3]);非常感谢zswang