我想通过抓包获取访问的url,但是存在如下问题:我在浏览器地址栏中输入:
http://user.qzone.qq.com/147975582/infocenter?ptlang=2052
抓包得到发出的请求:
Referer: http://user.qzone.qq.com/147975582/infocenter?ptlang=2052但是http://user.qzone.qq.com/147975582/infocenter?ptlang=2052
这个页面本身还会发出一些请求,比如:
Referer: http://ctc.qzs.qq.com/qzone/v5/owner2/new_default2_feeds.html
Referer: http://ctc.qzs.qq.com/qzone/gift/getbirthday.html
Referer: http://ctc.qzs.qq.com/qzone/custom/ic_qbs.html而我是根据解析http来获得url的,这样的话,我也会获得如下的url:
http://ctc.qzs.qq.com/qzone/v5/owner2/new_default2_feeds.html
http://ctc.qzs.qq.com/qzone/gift/getbirthday.html
http://ctc.qzs.qq.com/qzone/custom/ic_qbs.html
但是这三个并不是我主动调用的,而是由
http://user.qzone.qq.com/147975582/infocenter?ptlang=2052
这个页面发出的请求,那么如何来判断掉这些请求,而只得到如下这个url呢?
http://user.qzone.qq.com/147975582/infocenter?ptlang=2052
http://user.qzone.qq.com/147975582/infocenter?ptlang=2052
抓包得到发出的请求:
Referer: http://user.qzone.qq.com/147975582/infocenter?ptlang=2052但是http://user.qzone.qq.com/147975582/infocenter?ptlang=2052
这个页面本身还会发出一些请求,比如:
Referer: http://ctc.qzs.qq.com/qzone/v5/owner2/new_default2_feeds.html
Referer: http://ctc.qzs.qq.com/qzone/gift/getbirthday.html
Referer: http://ctc.qzs.qq.com/qzone/custom/ic_qbs.html而我是根据解析http来获得url的,这样的话,我也会获得如下的url:
http://ctc.qzs.qq.com/qzone/v5/owner2/new_default2_feeds.html
http://ctc.qzs.qq.com/qzone/gift/getbirthday.html
http://ctc.qzs.qq.com/qzone/custom/ic_qbs.html
但是这三个并不是我主动调用的,而是由
http://user.qzone.qq.com/147975582/infocenter?ptlang=2052
这个页面发出的请求,那么如何来判断掉这些请求,而只得到如下这个url呢?
http://user.qzone.qq.com/147975582/infocenter?ptlang=2052
能够根据http协议判断:
还有个问题,下面的请求:
GET /style/css/style.v2.css HTTP/1.1style/css/style.v2.css是什么意思,
看了http协议的内容没看到介绍的
不过帮不上大忙你说的
“但是这三个并不是我主动调用的,而是由
http://user.qzone.qq.com/147975582/infocenter?ptlang=2052
这个页面发出的请求,那么如何来判断掉这些请求”那大概这个页面会有一个返回的信息让你做类似重定向的东西吧?你有没有抓到他给返回的包?“GET /style/css/style.v2.css HTTP/1.1”这个是在下载你请求的网页的CSS文件吧
X-Requested-With: XMLHttpRequest
又是啥东东呢
Referer应该都是同一个主页面
Host:xxx //当前页面所在的服务器,有时也含端口(非默认的80时)浏览器的工作,其对于HTML页面必须进行:大量的页面包含的资源下载(图片、脚本、样式表、帧页等),xx.css,为外挂样式表文件
可是还是能得到一些其他的url,这个是怎么回事?
你分析HTTP的请求,关键的为
第一行:请求方式 资源位置 协议/版本,
GET /147975582/infocenter?ptlang=2052 HTTP/1.1
以及Host:服务器[:端口]
Host: ctc.qzs.qq.com