请教下各位大牛,如何抓取一个页面然后匹配页面中的所有链接是js的。目前我这么做的
function getLink($code){
  preg_match_all("/src=[\'\"]{0,1}([^>\'\"]*).*js/i"),$code,$link);
  return $link[1];
}可是调用的时候碰到页面理的js链接如下的时候就输出不正常了。http://www.test.com/1.js?eGo  
-----这个只能输出http://www.test.com/1.http://www.test.com/2.js
-----这个能正常输出http://www.test.com/2.js求指点

解决方案 »

  1.   

     preg_match_all("/src=[\'\"]{0,1}([^>\'\"]*.*js)/i"),$code,$link);
      

  2.   

    感谢xuzuning回答,但是这样还是匹配不正确,会有以下输出。
    aasdfasdf.js
    "type="text/javascript" mre_src=test.min.js
    asdfasdf.js
      

  3.   

    我查看了下源代码,有处是这样的<script src="test.js" type="text/javascript" mre_src="test.js"></script>导致输出的时候成这样了test.js" type="text/javascript" mre_src="test.js
      

  4.   

    preg_match_all("/src=[\'\"]{0,1}([^>\'\"]*.*js?)/i"),$code,$link); //这样呢?
      

  5.   

    preg_match_all("/src=[\'\"]{0,1}([^>\'\"]*.*js)/iU",$code,$link);结果中会包含 mre_src 部分的内容,若不想要,则
    preg_match_all("/\bsrc=[\'\"]{0,1}([^>\'\"]*.*js)/iU",$s,$link);
      

  6.   

    jordan102:这样会输出1.js?eGoxuzuning:貌似还是有问题。加上U的话,输出如下:
    test/js
    test1/js
    test2/js加上\b及\U输出结果同上,只加\b输出如下:aasdfasdf.js
    "type="text/javascript" mre_src=test.min.js
    asdfasdf.js
      

  7.   

    初衷是利用curl抓取页面,然后分析页面中所有的js,然后输出来,或者有其他更好的方法么?谢谢
      

  8.   

    $str='<script src="test.js" type="text/javascript" mre_src="test.js"></script>';
    $pattern='/\bsrc=[\'"]?([^"\']+\.js)/U';
    preg_match_all($pattern,$str,$matches);
    print_r($matches);