红象云腾:Hadoop将和高铁一样改变我们的生活 “高铁是动力分布式列车,每节车厢都有动力,这和Hadoop有神似之处。Hadoop也是每个节点有存储又有计算,提供充沛IO、CPU动力,我坚信Hadoop会像高铁改变我们生活一样改... hadoop spark 比较 2014-09-09
继Storm和Spark之后,Hortonworks添加对Kafka的支持 在Spark上,Hortonworks CTO Eric Baldeschwieler表示,Spark在不久的将来会取代Hadoop MapReduce,成为大数据生态圈内编写和分享算法的标准平台。... spark storm 比较 2014-08-29
快刀初试:SparkGraphX在淘宝的实践 由于SparkGraphX性能良好,又有丰富的功能和运算符,能在海量数据上自如运行复杂的图算法,淘宝尝试将它作为分布式图计算平台,进行各种算法尝试和生产应用。这篇文章结... Spark实践 2014-08-07
浅谈Apache Spark的6个发光点 50个机构250个工程师贡献过代码,和去年六月相比,代码行数几乎扩大三倍,这是个令人艳羡的增长。那么,究竟是什么支撑了Spark如此的增长,对比Hadoop又有什么优势,这里一起... Spark 学习 2014-08-07
从Storm和Spark学习流式实时分布式计算的设计 这篇文章主要探讨流式计算系统的设计要点,并且通过对Spark和Storm的实现来给出实例。通过对于系统设计要点的梳理,也可以帮助我们更好的学习这些系统的实现。... spark storm 比较 2014-08-04
Cloudera将Spark划入Hadoop Spark内存计算框架适合各种迭代算法和交互式数据分析,能够提升大数据处理的实时性和准确性。“Spark记录着数据产生的每一个操作,能够可靠地将这些数据存储在内存之... Hadoop实战 Hadoop Spark 2014-07-30
Hadoop vs Spark性能对比 使用Kmeans数据的对比hadoop和spark。读取HDFS上的block到内存,每个block转化为RDD,里面包含vector。然后对RDD进行map操作,抽取每个vector(point)对应的类号,输出(K,V)为... Hadoop安装 Spark性能 2014-07-26
大数据部署对比Hadoop 分析Spark受多方追捧的原因 Spark所谓的简单其实说的大多是关于Hadoop中的Java API而不是Spark本身。即使是简单的例子在Hadoop中通常也会有大量的样板代码。但从概念上讲,Hadoop非常简单,它只... Hadoop安装 Spark 2014-07-26
利用Scala语言开发Spark应用程序 本文将介绍3个Scala Spark编程实例,分别是WordCount、TopK和SparkJoin,分别代表了Spark的三种典型应用。... Hadoop Scala语言 scala 2014-07-21
将Spark部署到Hadoop 2.2.0上 将Spark部署到Hadoop 2.2.0上需要经过以下几步:步骤1:准备基础软件,步骤2:下载编译spark 0.8.1或者更高版本,步骤3:运行Spark实例。... Hadoop spark部署 2014-07-21
IBM以及英特尔都将Spark为Hadoop新核心 Cloudera、IBM、英特尔、DataBricks以及MapR之间建立起合作关系,希望将Apache Hive移植到Apache Spark当中... Hadoop教程 Spark 2014-07-21
Spark 大数据领域的小清新 Spark的简约是针对Hadoop的Java API。在Hadoop中即使最简单你的案例也有不少代码。但是从概念上说,Hadoop是很简单的,因为它仅提供了两个基本的操作,并行的mao和一个... Hadoop实战 spark 2014-07-21
取代而非补充,Spark Summit 2014精彩回顾 6月30日,为期三日的SparkSummit2014于旧金山拉开帷幕,12位来自Databricks、SAP、Cloudera、MapR、DataStax和Jawbone等公司的高管发表了主题演讲... Spark Summit 2014-07-17
Spark SQL深度理解篇:模块实现、代码结构及执行流程总览 这篇文章作者整理了对SparkSQL各个模块的实现情况、代码结构、执行流程情况以及分享了对SparkSQL的理解,无论是从源码实现,还是从SparkSQL实际使用角度,这些都很有参... Spark SQL 2014-07-15
Cloudera:除下Impala支撑部分,一切都将迁移至Spark 日前Spark汇聚了所有人的目光,就连有着自己流式计算框架的Cloudera都宣布了对它的拥抱。但Cloudera同时称,Impala将会是交互式SQLonHadoop的未来,该公司并不会用Spar... Spark 2014-07-04
2014 Spark美国峰会上几大顶级数据商精彩PPT分享 2014年SparkSummit于6月30日至7月2日在美国旧金山举行。来自使用Spark的一线技术公司及专家汇聚一堂,共同探讨目前Spark在企业的落地情况及未来Spark的发展方向和... spark技术峰会 2014-07-03
云服务新宠儿Spark和Hadoop,谁将是最后的赢家 Databricks和MapR分别为Spark和Hadoop进行大量融资,以推动其成长。两家公司对它们的融资情况是怎样的,两者未来的发展走势如何。凭借技术优势,它们的成长对未来业界... hadoop spark 比较 2014-07-02
广而告之:Databricks终止Shark项目,转至Spark SQL 日前Databricks宣布终止对Shark的开发,新的SQLonSpark项目将被SparkSQL代替。在此之外,HIVE-7292项目将是对Hive部分的补充,将Spark作为一个替代执行引擎提供给Hive... Spark SQL 2014-07-02