Cloudera与Databricks达成合作 Spark迈上企业级之路-Spark-中存储网

2013-10-31 18:16:00

来源
中存储网

Spark

Spark已经在大量的网络公司和网络创业公司中使用，一个旨在商业化Spark的初创公司Databricks近日获得了1400万美元的风险投资。

本年度Hadoop World会议上最火的一则消息可能就是Cloudera决定提供Apache Spark的全企业级支持——类似Hadoop发行版里的定制内容及付费产品支持，不仅仅是技术整合。这进一步证明了未来Hadoop的工作负载比现在和过去的看起来大不一样。

Spark是一个内存中的数据处理平台，兼容Hadoop数据源，但是比Hadoop MapReduce运行的更快。它非常适合机器学习作业，以及交互式数据查询，非常易于开发者使用，因为它包含了Scala、Python、Java的API。Spark已经在大量的网络公司和网络创业公司中使用，一个旨在商业化Spark的初创公司Databricks近日获得了1400万美元的风险投资。

实际上，Databricks是Cloudera Connet的第一个合作伙伴，它将帮助Cloudera提供支持，在Apache Spark未来发展中也将与大的Hadoop供应商合作，Cloudera公司联合创始人兼CTO Amr Awadallah解释了这个合作关系，也作为所有潜在客户的合作关系：将作为Cloudera所有感兴趣的客户创新的枢纽。Databricks以类似OEM的关系获益，但该协议仅限于扩展Apache Spark，不会发布任何商业版本的Databricks。

除下Databricks和Cloudera建立在Spark上的合作之外，Hortonworks也在致力流处理引擎Storm的企业级应用，这些探索都是非常重要的，因为只运行MapReduce的Hadoop永远都无法取得长期胜利。现在，YARN资源管理层已经可以投入使用，Cloudera和Hortonworks不用浪费任何时间为Hadoop未来的工作负载做准备，坦白来说，面对本质上Hadoop变成能支持可扩展性的开源数据层，我不明白过去几年那些对Hadoop持怀疑态度的人依然能够坚持，理论上，你可以使用它来处理任何类型。

Awadallah指出，虽然MapReduce仍然能流行一段时间，但是作为事实上的通用数据处理平台，Hadoop的未来应该更好。

原文链接： Spark is a really big deal for big data, and Cloudera gets it

声明： 此文观点不代表本站立场；转载须要保留原文链接；版权疑问请联系我们。

Cloudera与Databricks达成合作 Spark迈上企业级之路

Spark本地开发环境搭建过程

奥维云网智慧家庭技术路线及其背后的大数据架构

Apache Spark1.6预览版：更简便的搜索及诸多新特性

Databricks公司联合创始人、Spark首席架构师辛湜：Spark发展，回顾2015，展望2016

Spark首席架构师辛湜：谈项目现状与Roadmap

科技要闻

Intevac：24 财年第三季度财务业绩

SEMIFIVE 和 Synopsys 合作开发用于高级多晶粒设计的 HPC Chiplet 平台

全球第一！我国新能源汽车年度产量首次突破1000万辆

美方指控“与中国有关黑客”入侵多家电信公司网络，外交部驳斥

2024年第十批拟授予信息系统建设和服务能力贯标企业名单公示

Cloudera与Databricks达成合作 Spark迈上企业级之路

相关推荐

科技要闻