最近经常看到spark的新闻。
本人不懂,搜索了很多结果,还是不懂。
求解惑。  在哪些场合使用以及其作用。PS: openstack juno 也支持spark的特性, 云计算火爆,spark火爆。故关注一下。
困惑

解决方案 »

  1.   

          Spark是继Hadoop之后的新一代大数据分布式处理框架,是一种可扩展的数据分析平台,它整合了内存计算的基元,因此,相对于 Hadoop 的集群存储方法,它在性能方面更具优势。Spark 是在 Scala 语言中实现的,并且利用了该语言,为数据处理提供了独一无二的环境。
         Spark 是不断壮大的大数据分析解决方案家族中备受关注的新增成员。它不仅为分布数据集的处理提供一个有效框架,而且以高效的方式(通过简洁的 Scala 脚本)处理分布数据集。Spark 和 Scala 都处在积极发展阶段。不过,由于关键 Internet 属性中采用了它们,两者似乎都已从受人关注的开源软件过渡成为基础 Web 技术。
      

  2.   

    Spark是继Hadoop之后的新一代大数据分布式处理框架,是一种可扩展的数据分析平台,它整合了内存计算的基元,因此,相对于 Hadoop 的集群存储方法,它在性能方面更具优势。Spark 是在 Scala 语言中实现的,并且利用了该语言,为数据处理提供了独一无二的环境。
      

  3.   

    Spark是继Hadoop之后的新一代大数据分布式处理框架,是一种可扩展的数据分析平台,它整合了内存计算的基元,因此,相对于 Hadoop 的集群存储方法,它在性能方面更具优势。Spark 是在 Scala 语言中实现的,并且利用了该语言,为数据处理提供了独一无二的环境。
         Spark 是不断壮大的大数据分析解决方案家族中备受关注的新增成员。它不仅为分布数据集的处理提供一个有效框架,而且以高效的方式(通过简洁的 Scala 脚本)处理分布数据集。Spark 和 Scala 都处在积极发展阶段。不过,由于关键 Internet 属性中采用了它们,两者似乎都已从受人关注的开源软件过渡成为基础 Web 技术。
      

  4.   

    楼上的几位说的估计又是百度类似的话其实,spark你可以认为就是替代了你以前用的数据库的赶脚~! 以前你存数据在oracle mysql啊,而现在你要存储在spark上,那么存spark上是存哪里呢? 就是存在内存上。。将关系型数据库变成了非关系型数据库的赶脚呢~!我也是刚学不久,如上就是一个自我理解的赶脚~!不过,大概应该就是这个样子。
      

  5.   

    看官网的介绍吧
    http://spark.apache.org/
      

  6.   

    集hadoop MR & spark sql 与hive整合,图计算 GraphX ,机器学习ML,流式计算 spark streaming 为一身的新的数据计算框架