就大数据的核心而言,Hadoop是一个用于有效存储和处理大数据的开源架构。多年来,开源初创公司Cloudera和Hortonworks在Hadoop市场一直占有绝对地位,诸如Oracle、微软以及其他一些公司也想在这个市场占有一席之地,但更多是通过与专业的Hadoop初创公司建立伙伴关系间接地参与市场争夺。
大数据核心
根据Forrester分析的最新报告,传统技术供应商会推出一系列强势的产品战略,即使所推出的Hadoop产品仍有许多有待完善的地方。但厂商们却希望提供基于开源项目的稳定产品,直接通过开源技术的合作而获取产品成果,但可由于在开源领域所做的贡献太少,因此也很难有太大的影响力。
Hadoop:不是选配而是发展趋势
正确把握Hadoop发展趋势并不难,就像Forrester说的那样,Hadoop未来的发展主要取决于不断变化的数据基础设施,而且Hadoop已经成为“未来灵活数据管理平台的基石”。对技术供应商而言,想要跟上如今企业的步伐,它只需要一份关于Hadoop的报告。
企业对Hadoop之说以感兴趣,因为它使企业能够以较少的成本来存储和分析大量数据。根据Forrester发现,企业目前分析的数据只占到企业总数据的12%,是由于企业不知道该如何处理数据造成的。
Hadoop可以轻松实现大数据,因为它支持企业以更低的成本存储数据,一旦它们找到分析数据的最优办法,就可以对数据进行处理。
即便如此,一些企业将Hadoop看作“无人监管的数字垃圾场”,随着越来越了解Hadoop和大数据,企业将Hadoop的分析能力与NoSQL实时数据处理引擎结合在一起,用以从企业数据中收集有价值的部分,并及时采取行动。
对于Hadoop领域未来发展,什么样的供应商值得关注?
但Forrester建议我们不要仅仅关注那些在Hadoop上投入大量资金的供应商。
在开源领域,提供代码源甚至要比占有源码更为重要。同样,专有软件供应商靠软件授权收费,因为它对自己知识产权保密,开源供应商的市场力量与供应商对开源项目的影响力有直接关联,特别是对知识产权的把控上。
对于Forrester的分析也有一些不同的观点。MongoDB副总裁Matt Asay表示:不要只注重供应商Hadoop服务的当前状态,Forrester暗示未来真正的赢家应该是IBM、AWS和Pivotal这样的大型技术公司,而Hadoop初创公司对Hadoop发展作出的贡献最大。
出人意料的是,尽管“战略”包括了许可、定价、执行力、产品路线图和客户支持,Forrester对所有公司的社区扩展活动不作任何评论。像之前ReadWrite报道的那样,由于对Hadoop发展贡献的很少,像IBM和AWS这样的供应商很难决定Hadoop发展的方向,Hadoop创始人Doug Cutting断言:
我不期盼所有公司都为社区贡献一个项目,但那些不作出贡献的在Hadoop领域将没有发言权。
同样,Hortonworks首席执行官Rob Bearden表示:社区是保证Hadoop技术精密联系的关键。
Hadoop正在逐渐成为数据体系结构的核心基石,而且我们仍会努力做出贡献回报社区,确保新Hadoop内核能够将潜力在下一代数据平台上发挥出来。
开源领域也并非完全公平。例如亚马逊在MySQL上投入了大量的资金,比MySQL或者Oracle花的还多。同样,IBM在Linux上花的钱比Linux领域的领导者Red Hat还多。
但Forrester的观点可能也不完全正确,例如,在“客户支持”领域,Hortonworks的贡献可以打满分,因为Hortonworks为Hadoop社区贡献了很多代码,但Pivotal和IBM也获得相应的分值,这似乎并不具备说服力。
Forrester分析觉得IBM与AWS为Hadoop专有产品提供更好的客户支持。但那些对开源项目发展没有多少贡献的供应商,它们的客户支持能力也无法和投入很多的供应商相提并论。尽管IBM、Amazon和其他公司将来会构建基于Hadoop的优质服务,但难以提供很好的客户支持,因为总是被迫成为Hadoop追随者,而不是领导者。
Hadoop技术中强者
Forrester针对Hadoop供应商排名与Hadoop本身关系不大,更多与Hadoop如何融入公司长期产品战略相关,比如IBM的产品战略,从产品路线图看到包括继续将IBM其他产品(如SPSS高级分析,高性能计算工作的负载管理、BI工具以及数据管理和建模工具)与BigInsights Hadoop解决方案集成。
Hadoop对这些供应商而言,只是一个很好的补充而不是主要部分。
IBM、AWS等厂商尽管通过Hadoop丰富其产品会从市场获利,但对于那些想要从Hadoop本身获得价值的公司,可能更容易从对Hadoop发展贡献较大的企业(Cloudera和Hortonworks)获得好处,并且为Hadoop提供更好的支持。笔者认为IBM、AWS等厂商利用开源Hadoop技术完善产品推广市场并无问题,但为用户提供最好技术支持推动Hadoop社区长久并发展下去才是长远之计。
下一代统计数据使NFL可以在广播期间显示游戏统计信息,以增强粉丝的观看体验。
来自IT Brand Pulse的研究统计数据显示,在2020年,AWS成为收入排名第一的企业存储供应商。
AWS推出了五种EC2实例类型,四个新的容器功能,还增加了其边缘计算产品组合,其中包括两个较小的AWS Outposts设备。
这家云计算巨头将通过AWS的实物信用和对研究团队的技术支持为参与组织提供资金。
新的开源库,帮助开发人员使用几行代码编写基于机器学习的应用程序,这些应用程序使用图像、文本或表格数据集。
【聚焦搜索,数智采购】2021第一届百度爱采购数智大会即将于5月28日在上海盛大开启!
本次大会上,紫晶存储董事、总经理钟国裕作为公司代表,与中国—东盟信息港签署合作协议
XEUS统一存储已成功承载宣武医院PACS系统近5年的历史数据迁移,为支持各业务科室蓬勃扩张的数据增量和访问、调用乃至分析需求奠定了坚实基础。
大兆科技全方面展示大兆科技在医疗信息化建设中数据存储系统方面取得的成就。
双方相信,通过本次合作,能够使双方进一步提升技术实力、提升产品品质及服务质量,为客户创造更大价值。