郁闷,领导竟给我找麻烦,这个可能吗? 最近公司领导叫我写采集程序,晕倒还没写好,今天又来个任务。。就是给我一个新浪博客,我我用小偷查询其级别,研究了一上午也没找到接口,唉,大家有什么办法没有啊? 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 CURL 模拟一下取数据就OK了啊,然后正则,入库,搞定 取网页,再取内容!采集是搞 WEB的基本功了!采集好采,关链是解析!有字串取的,有正则的,有dom的!还有其他算法的(文本检索)!有get的,有POST的,有模拟浏览器的!高级的直接http! 我直接file_get_contents,然后用正则...是不是低级了点? 瞧了一眼,应该能做到:1、自己实现一下parseInt的功能,把用户名转换成16进制的代码2、获取http://hits.blog.sina.com.cn/hits?act=3&uid=<上面的16进制码>,你需要设定referer,否则新浪会禁止你取这个页面3、上面的页面里面有页面浏览数,然后按照这个区间得到级别:0,50,100,150,200,300,500,800,1500,3000,5000,10000,15000,25000,40000,70000,100000,150000,200000,500000,1000000,2000000,5000000,10000000,20000000,50000000,100000000,150000000,200000000,250000000,300000000,350000000,400000000,450000000,500000000,550000000比如,浏览数是234,级别应该是32(还是31啊?)还没找到parseInt在哪,哪位有闲心找找。 貌似parseInt是把整数变成16进制,javascript不熟,多包涵。获得用户ID的方法哪位有空看吧,累了。:D extjs中combox 从数据库读取数据不显示 求助:关于PHP文件中,用Ajax包含一个评论文件,该评论文件如何分页? PHP 有趣的小问题 我的文章系统的无限分类和新闻的一个疑惑 PHP循环table的显示问题 PHP的cookie如何跨服务器传值? 关于php的网上支付 怎么返回前一页面 请教用php语言描述一个加密算法。 为什么我的中文网页总是显示是乱的,必须在“编码”菜单里指定简体中文才行呢? PHP版权修改找不到,大家帮忙一下啊 define定义的常量与字符串连接
CURL 模拟一下取数据就OK了啊,然后正则,入库,搞定
采集是搞 WEB的基本功了!采集好采,关链是解析!有字串取的,有正则的,有dom的!还有其他算法的(文本检索)!有get的,有POST的,有模拟浏览器的!高级的直接http!
2、获取http://hits.blog.sina.com.cn/hits?act=3&uid=<上面的16进制码>,你需要设定referer,否则新浪会禁止你取这个页面
3、上面的页面里面有页面浏览数,然后按照这个区间得到级别:
0,50,100,150,200,300,500,800,1500,3000,5000,10000,15000,25000,40000,70000,100000,150000,200000,500000,1000000,2000000,5000000,10000000,20000000,50000000,100000000,150000000,200000000,250000000,300000000,350000000,400000000,450000000,500000000,550000000
比如,浏览数是234,级别应该是32(还是31啊?)还没找到parseInt在哪,哪位有闲心找找。