比如抓到下面这个页面,查看源文件的时候找不到歌曲的url了,
原来现实链接的地方成了 : 抱歉,本条结果已经失效,您需要重新
有没有办法可以抓到链接呢?
另外问下怎么抓取网址不变但页面内容会变的网页呢?
http://220.181.38.82/m?word=mp3,,,[%D3%F6%BC%FB+%CB%EF%D1%E0%D7%CB]&cat=0&ct=134217728&tn=baidusg,%D3%F6%BC%FB++&si=%D3%F6%BC%FB;;%CB%EF%D1%E0%D7%CB;;12299;;12299&lm=-1&sgid=1&size=4194304&attr=0,0&titlekey=502659319,2538760000

解决方案 »

  1.   

    url是变了的吧?
    你看get过来的参数是否变化。
      

  2.   

    记得以前看朋友抓过,原因是这样的:
    百度的mp3列表并不是直接以html形式放在页面上的。他返回给客户端的其实是一个加密的字符串。页面里面有个解密的js函数。代码到了客户端后,js的解密函数对传给你的加密串进行解密,变成html展示在页面上。
    所以你要做的是,用php仿照他的js解密函数写一个,将抓回来的那段加密串进行解密。mp3的链接都在那里面。好几年前是这样的,不知现在百度是否又改了方法。