网页数据抓取,网页源码没有所需数据 数据是ajax方式加载的用fiddler看浏览器加载数据的方式,用httpwebrequest模拟 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 我用的WebClient,是一样的吧?关键是数据地址不知道如何找啊 火狐浏览器的 firebug 插件不错,看的很清楚 用楼上的软件登陆网站 ,你会发现完全打开一个网页分好几步, 有的关键数据单独在一个get里面。 下了一个Fiddler,也搜遍了百度,还是不清楚如何查找数据地址。怎么用Fiddler查找真实的数据地址呢? http://caipiao.163.com/order/shishicai/#from=leftnav怎么找到这些数据的地址呢? http://caipiao.163.com/award/getAwardNumberInfo.html?gameEn=ssc&cache=1412674847161&period=141007069最后一个参数是期次 我也做过这样的工具,记得是在xml文件当中找到的。 下了一个Fiddler,也搜遍了百度,还是不清楚如何查找数据地址。怎么用Fiddler查找真实的数据地址呢?用浏览器浏览Fiddler设置为Capture然后会看到请求的地址,再不会Google下。 用firebug或者httpwatch或者fiddler在下面的url列表里一个一个地找,你所需要的数据源就在这些url里面,可能是json、xml、txt等等 IE9 以上,直接F12,捉包,什么都看得到 WebClient返回的只是你所请求的url页面数据,而无法获取异步加载的页面。就好比你请求的是地址a,WebClient只返回地址a的页面数据;像异步加载的地址b、c、d,WebClient是无法获取到的,除非用WebClient请求相应的地址b、c、d才行 没错,WebClient返回的只是你所请求的url页面数据,很可能只是这个网页的主体框架,是UI设计部分,里面的内容都是通过json和Ajax异步加载的,是一个函数或者内嵌的URL。要获取到这些内容,就要分析这个网页的构成,至少要把那个函数或者内嵌URL解析出来,然后通过代码获得数据。 没错,WebClient返回的只是你所请求的url页面数据,很可能只是这个网页的主体框架,是UI设计部分,里面的内容都是通过json和Ajax异步加载的,是一个函数或者内嵌的URL。要获取到这些内容,就要分析这个网页的构成,至少要把那个函数或者内嵌URL解析出来,然后通过代码获得数据。关键是,怎么找到数据URLa ? 已经说的很清楚了,用fiddler很容易就能看到。实在不会,你问问你的同事吧。 这个链接里就是开奖号码的数据,不过现在已经过期了,cache参数的值也可能是变化的。你就用fiddler或按f12,在请求的地址中找getAwardNumberInfo.html就应该能找到。最后一个参数period是期次,也是变化的。 http://caipiao.163.com/award/getAwardNumberInfo.html?gameEn=ssc&cache=1412910643773&period=141010031 比如说这个网页:http://adkjh.cailele.com/cqssc/5x_chzs.aspx最后一个期次的数据,始终查不到,然后使用fiddler:左边列表的所有URL我都试过了,都找不到数据地址,这是怎么回事呢? 比如说这个网页:http://adkjh.cailele.com/cqssc/5x_chzs.aspx最后一个期次的数据,始终查不到,然后使用fiddler:左边列表的所有URL我都试过了,都找不到数据地址,这是怎么回事呢?这个数据直接在页面的,你看看 属性和私有字段 新手,想用visual c#做BS,后台用oracle,用到dopod P800 pda,pda怎样连接到台式机的数据库? 安装VS。NET 2003时发生内部错误2337,请大家帮帮我! COM读数据出现乱码 紧急求助:关于Socket中Send中文字符的问题 C++如何调用WCF 多个webbrowser弹出js对话框 请帮一下忙.谢谢 正则表达式请教 如何在ListBox中分多列显示。 新手求教,程序看不懂,关于折线图的坐标。 真心跪地求教!!!在线等!!!追加500分!!!
怎么用Fiddler查找真实的数据地址呢?
怎么找到这些数据的地址呢?
最后一个参数是期次
怎么用Fiddler查找真实的数据地址呢?用浏览器浏览
Fiddler设置为Capture
然后会看到请求的地址,再不会Google下。
没错,WebClient返回的只是你所请求的url页面数据,很可能只是这个网页的主体框架,是UI设计部分,里面的内容都是通过json和Ajax异步加载的,是一个函数或者内嵌的URL。要获取到这些内容,就要分析这个网页的构成,至少要把那个函数或者内嵌URL解析出来,然后通过代码获得数据。
没错,WebClient返回的只是你所请求的url页面数据,很可能只是这个网页的主体框架,是UI设计部分,里面的内容都是通过json和Ajax异步加载的,是一个函数或者内嵌的URL。要获取到这些内容,就要分析这个网页的构成,至少要把那个函数或者内嵌URL解析出来,然后通过代码获得数据。
关键是,怎么找到数据URLa ?
你就用fiddler或按f12,在请求的地址中找getAwardNumberInfo.html就应该能找到。
最后一个参数period是期次,也是变化的。
这个数据直接在页面的,你看看