本帖最后由 u013704019 于 2014-04-15 15:06:06 编辑

解决方案 »

  1.   

    $RuleCM = '/<ul\sdata-property=\"颜色分类\"\sclass=\"tb-clearfix J_TSaleProp tb-img\s+\">(.*)<\/ul>/sU';另外需要注意,因为淘宝是gbk编码,如果你用utf-8编码,记得要将$text 转码一下。
      

  2.   

    $RuleCM = '/<ul.*?data-property=".*?".*?class="tb-clearfix.*?J_TSaleProp.*?tb-img.*?">(.*?)<\/ul>/is';
      

  3.   


    header('content-type:text/html;charset=utf-8');

    //获取淘宝某个链接的内容
    $text =file_get_contents('http://item.taobao.com/item.htm?
    spm=a310p.3047441.6826329.1.daHxR7&id=26387776421');//尺码
    $RuleCM = '#<ul data-property="颜色分类" class="tb-clearfix J_TSaleProp tb-img  ">(.*)</ul>#iUs';//转码
    $text=iconv('GBK','UTF-8',$text);preg_match($RuleCM,$text,$matches);
    echo '<pre>';
    print_r($matches);
      

  4.   

    我建议你还是使用xpath来解析吧。