ajax读取信息加上登录验证信息就很难被采集了

解决方案 »

  1.   

    获取“查看联系方式”超链接的href属性,重新发一次请求应该就行了。
      

  2.   

    就是源代码里的<a href="http://fang.taobao.com/fang/showrentout.html?city=168&amp;resourceId=ra92d8165497f42da8372543aefa52d29">查看联系方式</a>
    把href属性的值取出来,然后url解码,得到url,以此url重新httprequest一次,取得真正的网页。
      

  3.   

    更正一下:url解码这步是多余的。
      

  4.   

    找到原因的. 
    就是这个地址
    http://fang.taobao.com/fang/showrentout.html?city=168&amp;resourceId=ra92d8165497f42da8372543aefa52d29
    直接在代码访问是不行的. 要把"amp;" 去掉
    访问
    http://fang.taobao.com/fang/showrentout.html?city=168&resourceId=ra92d8165497f42da8372543aefa52d29
    这样就行了是我太着急了, 没认真看. 在源码里点连接无法访问OH YEAR 口碑, 俺又来了, 准备继续接受我的定时采集吧
      

  5.   

    这个简单哈,用sql根据session里面的值查询就行了哈