u :unicode 的缩写,表示待匹配的串是一个符合 unicode 编码规则的串,比如 utf-8 编码的串
在 u 修饰符下,一个汉字被当做一个字符被处理。\w 有原来的 [_0-9A-Za-z] 扩展到汉字

解决方案 »

  1.   

    \w 由原来的 [_0-9A-Za-z] 扩展到汉字,
    \w是匹配任意一个数字、字母、下划线的,扩展到汉字是什么意思?
      

  2.   

    $s = '汉字abc';
    preg_match_all('/\w/', $s, $r); //没有 u 修饰
    print_r($r);

    Array
    (
        [0] => Array
            (
                [0] => a
                [1] => b
                [2] => c
            ))
    $s = '汉字abc';
    preg_match_all('/\w/u', $s, $r); //有 u 修饰
    print_r($r);

    Array
    (
        [0] => Array
            (
                [0] => 汉
                [1] => 字
                [2] => a
                [3] => b
                [4] => c
            ))
      

  3.   

    版主大大 写个适合新手学习的正则吧。
    还有.net的正则和php的正则区别大吗?
    http://deerchao.net/tutorials/regex/regex.htm
    这个人写的.net通俗易懂 ,求版主大大同样来个