看了 spark 快速大数据分析 这本书,感觉还不错。
搭建了hadoop2.x完全分布式集群,在yarn 部署spark,写一写书上的例子。
请问还有什么比较适合/不错的spark书(学习资料)推荐,谢谢!

解决方案 »

  1.   

    Learning Spark中文版(3-8章)图计算的有这本
    Apache Spark GraphX Process中文版前4章英文完整版的资源里应该都能搜到
      

  2.   

    英文好的 最好的是官方的文档和介绍 很多书都是抄那个 抄来抄去的中文部分,除了你说的那本书还有的就是Spark MLlib机器学习:算法、源码及实战详解、Spark高级数据分析、Spark最佳实践(这本是腾讯的人写的)、  Spark核心源码分析与开发实战后面两本比较新,特别说一下这块的书最看比较新的,更新换代比较大,还有就是很多书都大同小异,全部看完后觉得并不是很适合。套路我在这里总结一下:官方介绍、事例、部分文档翻译一下,重新编排一下,不到10%的自己操作的过程和总结。这方面的书基本上是spark开头的我都买过了看了,最后强烈建议还是官方。