<username>ADMIN</username><password>sdfsdfsdfs</password><age>26</age>
<username>johnman</username><password>4tdfgdfgdfg</password><age>21</age>
<username>tomson</username><password>567rtfgdfgdgdf</password><age>33</age>
<username>prig</username><password>sdfsg4gdfgdfgdf</password><age>18</age>类似这样的文本资料,一行代表一条数据,分别将用户名,密码,年龄匹配出来入库,比如上面的第一条为
admin  sdfsdfsdfs  26 为一条。
在使用php中,使用正则来匹配,开始:<username>结束:</username>这样类匹配,结果全部数据都出来了,估计是第一个<username>没有用第一个</username>来结束,而是用了倒数第一个,所以中间的全部都作为匹配结果了。
大家有何高见,或者贴点关键代码,为了这个,想了一晚上,今天上班累啊。

解决方案 »

  1.   

    2.1 匹配次数中的贪婪与非贪婪    在使用修饰匹配次数的特殊符号时,有几种表示方法可以使同一个表达式能够匹配不同的次数,比如:"{m,n}", "{m,}", "?", "*", "+",具体匹配的次数随被匹配的字符串而定。这种重复匹配不定次数的表达式在匹配过程中,总是尽可能多的匹配。比如,针对文本 "dxxxdxxxd",举例如下:表达式
    匹配结果(d)(\w+)
    "\w+" 将匹配第一个 "d" 之后的所有字符 "xxxdxxxd"(d)(\w+)(d)
    "\w+" 将匹配第一个 "d" 和最后一个 "d" 之间的所有字符 "xxxdxxx"。虽然 "\w+" 也能够匹配上最后一个 "d",但是为了使整个表达式匹配成功,"\w+" 可以 "让出" 它本来能够匹配的最后一个 "d"    由此可见,"\w+" 在匹配的时候,总是尽可能多的匹配符合它规则的字符。虽然第二个举例中,它没有匹配最后一个 "d",但那也是为了让整个表达式能够匹配成功。同理,带 "*" 和 "{m,n}" 的表达式都是尽可能地多匹配,带 "?" 的表达式在可匹配可不匹配的时候,也是尽可能的 "要匹配"。这 种匹配原则就叫作 "贪婪" 模式 。    非贪婪模式:    在修饰匹配次数的特殊符号后再加上一个 "?" 号,则可以使匹配次数不定的表达式尽可能少的匹配,使可匹配可不匹配的表达式,尽可能的 "不匹配"。这种匹配原则叫作 "非贪婪" 模式,也叫作 "勉强" 模式。如果少匹配就会导致整个表达式匹配失败的时候,与贪婪模式类似,非贪婪模式会最小限度的再匹配一些,以使整个表达式匹配成功。举例如下,针对文本 "dxxxdxxxd" 举例:表达式
    匹配结果(d)(\w+?)
    "\w+?" 将尽可能少的匹配第一个 "d" 之后的字符,结果是:"\w+?" 只匹配了一个 "x"(d)(\w+?)(d)
    为了让整个表达式匹配成功,"\w+?" 不得不匹配 "xxx" 才可以让后边的 "d" 匹配,从而使整个表达式匹配成功。因此,结果是:"\w+?" 匹配 "xxx"    更多的情况,举例如下:    举例1:表达式 "<td>(.*)</td>" 与字符串 "<td><p>aa</p></td> <td><p>bb</p></td>" 匹配时,匹配的结果是:成功;匹配到的内容是 "<td><p>aa</p></td> <td><p>bb</p></td>" 整个字符串, 表达式中的 "</td>" 将与字符串中最后一个 "</td>" 匹配。    举例2:相比之下,表达式 "<td>(.*?)</td>" 匹配举例1中同样的字符串时,将只得到 "<td><p>aa</p></td>", 再次匹配下一个时,可以得到第二个 "<td><p>bb</p></td>"。
    引用网址:http://www.regexlab.com/zh/regref.htm
    可能对楼主有所帮助。
      

  2.   

    用preg_match(),不要用preg_match_all()
    示例
    preg_match("/<username>(.*?)</username></",目标代码,$返回结果数组);
    echo $返回结果数组[1];//这里会输出你想要的结果ADMIN
    给分吧
      

  3.   

    preg_match_all("/<username>(.*?)<\/username><password>(.*?)<\/password><age>(.*?)<\/age>/i", $str, $array);我这很好用的 print_r($array) 看看,里面有你想要的东西了!