本帖最后由 cnaaa8 于 2012-06-09 13:27:59 编辑

解决方案 »

  1.   

    file_get_contents();  获取到源码后再用正则提取。
      

  2.   

    我知道是file_get_contents 但是如何提取出来啊
      

  3.   

    分析HTML
    如果你不会分析HTML的话说了你可能也无从下手。
      

  4.   

    <a href="#" class="J_show_list J_MakePoint" data-point-val="tbrate.2.3.1" data-param="timeLine=-30&amp;result=1">23323</a>正则匹配这个就可以了。
      

  5.   

    $url = 'http://rate.taobao.com/user-rate-39512.htm';$s = file_get_contents($url);preg_match_all('#class="J_show_list J_MakePoint".+tbrate\.([\d.]+?).+>(\d+)</a>#isU', $s, $r);print_r($rArray
    (
        [0] => Array
            (
                [0] => class="J_show_list J_MakePoint" data-point-val="tbrate.2.2.1" data-param='timeLine=-7&result=1'>5250</a>
                [1] => class="J_show_list J_MakePoint" data-point-val="tbrate.2.2.2" data-param='timeLine=-7&result=0'>13</a>
                [2] => class="J_show_list J_MakePoint" data-point-val="tbrate.2.2.3" data-param='timeLine=-7&result=-1'>8</a>
                [3] => class="J_show_list J_MakePoint" data-point-val="tbrate.2.3.1" data-param='timeLine=-30&result=1'>23123</a>
                [4] => class="J_show_list J_MakePoint" data-point-val="tbrate.2.3.2" data-param='timeLine=-30&result=0'>74</a>
                [5] => class="J_show_list J_MakePoint" data-point-val="tbrate.2.3.3" data-param='timeLine=-30&result=-1'>36</a>
                [6] => class="J_show_list J_MakePoint" data-point-val="tbrate.2.4.1" data-param='timeLine=-210&result=1'>294425</a>
                [7] => class="J_show_list J_MakePoint" data-point-val="tbrate.2.4.2" data-param='timeLine=-210&result=0'>1616</a>
                [8] => class="J_show_list J_MakePoint" data-point-val="tbrate.2.4.3" data-param='timeLine=-210&result=-1'>796</a>
            )    [1] => Array
            ( /** 很显然标识数据类别的这节是不能少的 **/
                [0] => 2.2.1
                [1] => 2.2.2
                [2] => 2.2.3
                [3] => 2.3.1
                [4] => 2.3.2
                [5] => 2.3.3
                [6] => 2.4.1
                [7] => 2.4.2
                [8] => 2.4.3
            )    [2] => Array
            (
                [0] => 5250
                [1] => 13
                [2] => 8
                [3] => 23123
                [4] => 74
                [5] => 36
                [6] => 294425
                [7] => 1616
                [8] => 796
            ))
      

  6.   

    我发现PHP版一直删我楼,艹了
      

  7.   


    我要同时匹配这两段字符,该如何写正则呢
    <a href="http://ratehis.taobao.com/user-rate-39512--isarchive|true--detailed|1--goodNeutralOrBad|1--timeLine|-211--receivedOrPosted|0--buyerOrSeller|0.htm#RateType" class="J_MakePoint" data-point-val="tbrate.2.5.1">4508530</a><a href="#" class="J_show_list J_MakePoint" data-point-val="tbrate.2.4.1" data-param='timeLine=-210&result=1'>289048</a>提示:
    第一个的:class="J_MakePoint" data-point-val="tbrate.2.5.1">4508530</a>
    第二个的:class="J_show_list J_MakePoint" data-point-val="tbrate.2.4.1" data-param='timeLine=-210&result=1'>289048</a>
    都是需要提取<a>标签内的数字,如第一个中搞定4508530和第二个中的289048,用一个正则匹配