还不清楚你的需求
是去html标签还是取其中的中文字符?

解决方案 »

  1.   

    <?php
    $s = '这里<d name="junbin">s</d>这里<html>sss<body><p class="name">The classname is not seen as a different tag</p></body></html>这里';preg_match_all("/[".chr(0xa1)."-".chr(0xff)."]+/", $s, $r);
    var_dump($r);
    ?>
      

  2.   

    (?<=</)\w[^>]*>(\w[^<\s])
      

  3.   

    wasuka(喋喋不休的食尸鬼) ( ) 信誉:94 
    牙,偶是为了方便看清楚写中文的<?php
    $s = 'zheli<d name="junbin">s</d>zheli2<html>sss<body><p class="name">The classname is not seen as a different tag</p></body></html>zhelddi8';preg_match_all("/[".chr(0xa1)."-".chr(0xff)."]+/", $s, $r);
    var_dump($r);
    ?>
      

  4.   

    (?<=</)\w[^>]*>(\w[^<\s])
    这个你自己测试过吗,是php的正则吗?$s = 'zheli<d name="junbin">s</d>zheli2<html>sss<body><p class="name">The classname is not seen as a different tag</p></body></html>zhelddi8';preg_match_all("/(?<=</)\w[^>]*>(\w[^<\s])"]+/", $s, $r);
    var_dump($r);
    ?>报错啊
    Warning: preg_match_all() [function.preg-match-all]: Unknown modifier ')' in C:\xampp\htdocs\hua2r\dfg.php on line 29
    NULL
      

  5.   

    ecitnet(杀虫剂) ( ) 信誉:
    还不清楚你的需求
    是去html标签还是取其中的中文字符?不是去标签,是把笔标签里面的都去掉,只剩下中文字那块
    当然不是取中文,中文写的只是为了方便看,取中文的正则我自己会写。麻烦各位哈,顶者有分,西西O.o
      

  6.   

    wasuka(喋喋不休的食尸鬼) ( ) 信誉:94  2007-08-22 16:22:21  得分: 0  
     
     
       毫无规则可言。不会
      
     
    有规则的啊,其实你把标签和标签的内容都弃掉的话,就是那些内容了的说。
    我可以匹配标签和标签内容的正则
    $htmlPattern = '/<((\w+)\s*(\w+(=(\'|\").*?\\5)?\s*)*)>(.*)?<\/\\2>/i';然后用正则替换替换掉,但是觉得这样麻烦
    想直接把去掉标签和标签内容的东西提取出来会比较明白一些
    就这个意思。
    有规律的