《程序员9月B刊:大数据核心技术与实践》火热上市!
大数据实战与技术专题,摘录了电商、游戏、移动等领域的大数据应用,覆盖当下热门的大数据开源技术实践与技术细节,如Hadoop、Spark、Docker等,带大家一览这些精彩实践赖以成型的根本——繁华的开源大数据生态圈。...
大数据实战与技术专题,摘录了电商、游戏、移动等领域的大数据应用,覆盖当下热门的大数据开源技术实践与技术细节,如Hadoop、Spark、Docker等,带大家一览这些精彩实践赖以成型的根本——繁华的开源大数据生态圈。...
黄洁就Spark的内存管理、IO提升和计算优化3个方面进行了详细讲解。黄洁表示,对比MapReduce,Spark擅长于复杂的机器学和图的计算、流处理等多种业务场景。...
由于SparkGraphX性能良好,又有丰富的功能和运算符,能在海量数据上自如运行复杂的图算法,淘宝尝试将它作为分布式图计算平台,进行各种算法尝试和生产应用。这篇文章结合GraphX的原理和特点,分享其在淘宝的应用实践。...
本次不谈Spark中什么复杂的技术实现,只稍为聊聊如何进行代码跟读。众所周知,Spark使用Scala进行开发,由于Scala有众多的语法糖,很多时候代码跟着跟着就觉着线索跟丢掉了,另外Spark基于Akka来进行消息交互,那如何知道谁是接收方呢?...