我要获取一些链接, 来测试自己学习正则式是否有成果!目标页 我通过FILE_GET_CONTENT 拿下来后!他页面的 目标链接 10个, 感觉是加密的 , 网址类型是 http://click.xxx1.xxx.com/jc_ii?p=ac&a=saqwasdasawqwdsdasaqwddksjkdksjdhjahsuywuhjhjasdhjhdjhjshjdhhjhdjshu1sase8&a=qwwa&r=aswq点开后的地址为 http://ap4aswq.xxx.com/news/12343454.html这类我应该如何去获取, 完全没办法! 没有可解决的!

解决方案 »

  1.   

    应该是在服务器端用规则做了解析,然后定向到对应的地址!lz是问:http://click.xxx1.xxx.com/jc_ii?p=ac&a=saqwasdasawqwdsdasaqwddksjkdksjdhjahsuywuhjhjasdhjhdjhjshjdhhjhdjshu1sase8&a=qwwa&r=aswq如何转换成http://ap4aswq.xxx.com/news/12343454.html么?这个你只能去问写代码的了!
      

  2.   

    呵呵 这个可以用curl啊
    先抓取整个页面,用正则匹配出10条地址
    再用curl连接每一个地址
    CURLOPT_FOLLOWLOCATION 设置成 1
    再用正则抓取其返回地址,就能实现了。楼主要应该给出真实的网页地址,我看看能不能实现。
      

  3.   


    我是用的CURL采集的, 朋友说FOLLOWLOCATION获取不了!