2014-05-12 00:00:00
来 源
中存储网
Hadoop
刘刚表示,目前Hadoop的应用正在从互联网行业到传统行业快速的扩张,但是在传统行业中Hadoop还是要面临很多困难:Hadoop的安全性不能满足他们的需求;Hadoop的人才缺少;怎么把传统的业务迁移到Hadoop平台上来处理。-什么原因吸引你钻研Had

刘刚表示,目前Hadoop的应用正在从互联网行业到传统行业快速的扩张,但是在传统行业中Hadoop还是要面临很多困难:Hadoop的安全性不能满足他们的需求;Hadoop的人才缺少;怎么把传统的业务迁移到Hadoop平台上来处理。

 -什么原因吸引你钻研Hadoop技术?

记得四年前跟着PKU的曹老师做项目的时候,曹老师让我去调研大数据技术,那个时候hadoop资料很少,只能去看官方的文档。印象最深的是花了两周搭建了一个节点的hadoop集群。过程虽然困难,当搭建成功的那一刻,所有的困难全部变成了宝贵的经验。

Hadoop自带了分布式存储(HDFS)和分布式计算(MapReduce),随着互联网的快速发展,网络上产生的数据量越来越大,这些数据80%以上是非结构花的,所以存在传统的Oracle或者Mysql里面已经不合适了。这个时候,Hadoop可以完美的解决这个问题。不仅解决了存储问题,同时计算的问题也解决了。

  -对于解决哪些问题Hadoop独具优势?

Hadoop在国内使用差不多快6年左右了,目前来看Hadoop在互联网行业使用的比较广泛,主要用于:

1)日志的存储和离线分析。

2)基于Mahout的推荐挖掘。

3)使用Hbase来实现一些半实时的应用。

 -目前企业应用Hadoop最大的困难是什么?

在互联网企业Hadoop的使用还是比较好的,但是在传统的行业里面(银行、电信),使用Hadoop还是有困难的。

1)Hadoop的安全性不能满足他们的需求。

2)Hadoop的人才缺少。

3)最重要的是怎么把传统的业务迁移到Hadoop平台上来处理。

  -根据您的了解,目前Hadoop发展的情况如何?

Hadoop在未来5-10年还是海量数据存储和计算的首选工具,目前发展的非常迅速,而且正在从互联网行业向传统行业发展。

  -请谈谈你在这次Hadoop培训上即将分享的话题。

我将会分享Hive实战课程,希望通过这次分享,能够让大家掌握使用Hive来分析Hadoop上面的数据。这次讲课以一个Hive的项目开始,来逐一讲解Hive的常用功能和实战经验。

  -哪些人群应该来参加本次培训?会对他们有哪些帮助?

1)对Hadoop感兴趣的人

2)数据分析师

3)DBA

原文链接:http://www.csdn.net/article/2014-05-12/2819721-Hadoop-Hive

声明: 此文观点不代表本站立场;转载须要保留原文链接;版权疑问请联系我们。