最好有整个抓取的过程代码,thanks!
没有大家也可以在这里讨论一下思路~

解决方案 »

  1.   

    当然curl了,不好意思少打了。
      

  2.   

    大陆估计研究facebook的人少之又少……
    到洋人的论坛去寻求方案吧
      

  3.   

    哎,只能自己摸索着来了,人人网的还好一些,虽然人人的API少的很可怜,主要麻烦是要不停地翻墙测试,很纠结……
      

  4.   

    主要工作应该有2部分吧.
    1. http客户端(curl用的很少, 其实自己用fsock/socket实现一个简单的http客户端也很方便, 自己去控制, 做好cookie的使用和redirect, 能够保留session就应该OK了.)
    2. 内容抓取分析(这个就不好说了, html的内容感觉用xml解析会容易些)另外, 可以尝试下loadrunner这样的自动化测试工具, 用loadrunner做这个需求应该是比较简单的.
      

  5.   

    好的,我这就去试试,不过http根本就当初没学好的说,哎……
      

  6.   

    因为人人的API我就用过,功能一点也不强大,导致不想用API,毕竟我只是抓取网站好友的一小部分信息,这样的功能其实我很想不通过API实现的。
      

  7.   

    目前普通抓取是不可以的,不然google和facebook也不至于吵得这么凶……好友信息facebook一直不大同意对外开放。
      

  8.   

    facebook抓取好友的邮箱是需要一个另外的permission的,直接抓是抓不到的