我想通过抓包获取访问的url,但是存在如下问题:我在浏览器地址栏中输入:
http://user.qzone.qq.com/147975582/infocenter?ptlang=2052
抓包得到发出的请求:
Referer: http://user.qzone.qq.com/147975582/infocenter?ptlang=2052但是http://user.qzone.qq.com/147975582/infocenter?ptlang=2052
这个页面本身还会发出一些请求,比如:
Referer: http://ctc.qzs.qq.com/qzone/v5/owner2/new_default2_feeds.html
Referer: http://ctc.qzs.qq.com/qzone/gift/getbirthday.html
Referer: http://ctc.qzs.qq.com/qzone/custom/ic_qbs.html而我是根据解析http来获得url的,这样的话,我也会获得如下的url:
http://ctc.qzs.qq.com/qzone/v5/owner2/new_default2_feeds.html
http://ctc.qzs.qq.com/qzone/gift/getbirthday.html
http://ctc.qzs.qq.com/qzone/custom/ic_qbs.html
但是这三个并不是我主动调用的,而是由
http://user.qzone.qq.com/147975582/infocenter?ptlang=2052
这个页面发出的请求,那么如何来判断掉这些请求,而只得到如下这个url呢?
http://user.qzone.qq.com/147975582/infocenter?ptlang=2052

解决方案 »

  1.   

    这个我觉得在HTTP协议里是判断不出来的
      

  2.   

    不知道有谁http协议比较熟悉的
    能够根据http协议判断:
    还有个问题,下面的请求:
    GET /style/css/style.v2.css HTTP/1.1style/css/style.v2.css是什么意思,
    看了http协议的内容没看到介绍的
      

  3.   

    我也在做这方面的,关注下
    不过帮不上大忙你说的
    “但是这三个并不是我主动调用的,而是由
    http://user.qzone.qq.com/147975582/infocenter?ptlang=2052
    这个页面发出的请求,那么如何来判断掉这些请求”那大概这个页面会有一个返回的信息让你做类似重定向的东西吧?你有没有抓到他给返回的包?“GET /style/css/style.v2.css HTTP/1.1”这个是在下载你请求的网页的CSS文件吧 
      

  4.   

    有没有比较详细介绍http协议的文章啊发现有的请求里面还有这个
    X-Requested-With: XMLHttpRequest
    又是啥东东呢
      

  5.   

    x-requested-with:XMLHttpRequest说明是异步请求,同步的没有则个。能发来你的程序看看么?[email protected]
      

  6.   

    用 Referer来判断,如果是一个页面里发出的请求,那
    Referer应该都是同一个主页面
      

  7.   

    当然Referer本身是可以伪造的。
      

  8.   

    Referer:xxxx //含义为当前页面是通过该页面引导的请求,即Parent Page
    Host:xxx //当前页面所在的服务器,有时也含端口(非默认的80时)浏览器的工作,其对于HTML页面必须进行:大量的页面包含的资源下载(图片、脚本、样式表、帧页等),xx.css,为外挂样式表文件
      

  9.   

    但我就是分析的Referer:xxxx 来获得url 的,
    可是还是能得到一些其他的url,这个是怎么回事?
      

  10.   

    Referer:xxxx ,不是当前的URL,如其意,只是一个引用参考
    你分析HTTP的请求,关键的为
    第一行:请求方式 资源位置 协议/版本,
    GET /147975582/infocenter?ptlang=2052 HTTP/1.1
    以及Host:服务器[:端口]
    Host: ctc.qzs.qq.com
      

  11.   

    你的意思是只要得到Host: ctc.qzs.qq.com这个就可以了,其他的不用管了吗