高效、多功能 运用Spark加速实时数据分析 在今天,能够满足上文提到的需求而引起了业界人士浓厚兴趣与广泛的支持的一项重要的新技术,就是Apache Spark。从能源产业到金融行业,Spark凭借其高效性与多功能性已... Spark分析 2015-10-28
IBM推出Apache Spark云服务 继今年六月份IBM宣布对Spark提供三百万美金的投资,IBM现在推出ApacheSpark云服务,立志打造一个完全数据分析平台。... Spark云服务 2015-10-27
TalkingData大规模机器学习的应用 为了尽可能提高集群计算效率和程序开发效率,我们选择了Spark。我们认为Spark最大的两个优点。一是数据处理效率高(相对于Hadoop MapReduce而言)。二是开发效率高。... TalkingData 机器学习 2015-10-23
2015年20个获奖的最佳开源大数据工具 InfoWorld在分布式数据处理、流式数据分析、机器学习以及大规模数据分析领域精选出了2015年的开源工具获奖者,下面我们来简单介绍下这些获奖的技术工具。... 开源spark项目 2015-10-20
量化派基于Hadoop、Spark、Storm的大数据风控架构 为了满足日益增长变化的业务,量化派在大数据平台建设中全面拥抱开源的基础上,进行了不停迭代设计,采用了Hadoop、Spark、Storm等热门的开源大数据计算引擎。... spark架构实践 大数据架构 2015-10-06
Spark1.5版本说明 ApacheSpark1.5版本发布了,这篇文章概述了Spark1.5中的几个主要开发主题与一些令人期待的新功能特性。Spark1.5的大部分重大改动位于底层,更好地提升Spark的性能、... Spark 学习 2015-10-03
杨鹏分享世纪佳缘推荐和机器学习算法实践 世纪佳缘推荐和机器学习算法实践,世纪佳缘算法工程师杨鹏在CSDN人工智能用户群分享了“世纪佳缘推荐和机器学习算法实践”。他主要介绍了基于图算法产生候选集、排... Spark实践分享 2015-09-30
逆水行舟,看前行中的Spark 在生态建设上,Spark取得极大的成功,其主要体现在application、environment及datasource三方面。Spark的贡献者目前超过650人,围绕Spark创业的公司同样增多,“Sparkasa... Spark 2015-09-21
英特尔段建钢:Spark将成为下一代大数据的标准 英特尔推出了Apache Spark,为Hadoop集群带来了速度极高的内存内分析能力,从而将大规模数据集的处理周期由几小时成功缩短为几分钟。目前英特尔和优酷合作,帮助优酷将... Spark 大数据标准 2015-09-18
《程序员9月B刊:大数据核心技术与实践》火热上市! 大数据实战与技术专题,摘录了电商、游戏、移动等领域的大数据应用,覆盖当下热门的大数据开源技术实践与技术细节,如Hadoop、Spark、Docker等,带大家一览这些精彩实践... Spark实践 2015-09-15
西兰赛车董事会与Spark Digital签订五年合约,建设多项云计算服务 Spark Digital还将提供新西兰赛车董事会外包的IT技术,包括云基础设施、网络、云计算、安全与IT服务管理。这笔交易将会提供金融储蓄以及其在高峰时期扩展IT需求的... Spark云服务 2015-09-15
Cloudera旨在以Spark取代MapReduce作为默认Hadoop框架 Brandwein说他们的长期的目标是,使Spark工作规模同时在多租户集群拥有超过10000个节点成为可能,这需要Spark的可靠性、稳定性和效率显著改善。... hadoop spark 比较 2015-09-11
盘点大数据生态圈,那些繁花似锦的开源项目 过去数年,大数据开源生态圈得到了长足的发展——在数据的整个生命周期中,各种开源技术框架林立。而在这些开源技术的基础上,业内涌现出一系列令人敬佩的大数据架构实... 开源spark项目 2015-09-11
Apache Spark1.5新特性介绍 ApacheSpark社区刚刚发布了1.5版本,大家一定想知道这个版本的主要变化,这篇文章从DataFrame执行后端优化(Tungsten第一阶段)、DataFrameSQLHive、机器学习MLlib等角度... Spark 教程 2015-09-10
Apache Spark在大规模分布式自然语言处理的应用 TripAdvisor基于自然语言构建回归模型预测用户对每个问题回答“是”或“不是”的概率。不仅用带有标签的地点评价数据训练模型,还使用了大量未标记的数据。基于Spa... 分布式文件系统 2015-09-07
数一数Apache Spark 不过时的六大理由 Spark却可以解决大数据时代中很多关键问题,推动大数据以惊人的速度发展。这就是尽管其还很年轻,我们的“Big Data Discovery”平台依旧使用Apache spark 作为底层技... Apache Spark 2015-09-01
Apache Spark不过时的六大理由 Spark可能并不成熟,但将会持续下去。这篇文章作者PeterSchlampp是大数据分析提供商Platfora产品副总裁,他认为Spark的时代才刚刚开始。... Spark 2015-08-26
QingCloud推出Spark即服务 随着数据量的爆炸式增长、数据来源和结构的多样化,传统IT基础架构已无法满足企业对数据处理的需求,Hadoop、Spark等支持PB级别数据的分布式存储和分布式计算框架应... Spark 2015-08-25