Hadoop

谈谈关于Hive的那些事儿

谈谈关于Hive的那些事儿Hive是一种建立在Hadoop文件系统上的数据仓库架构,并对存储在HDFS中的数据进行分析和管理;那么,我们如何来分析和管理那些数据呢?...

Hadoop实战 hive

漫谈Hadoop中的文件压缩

漫谈Hadoop中的文件压缩bzip2压缩比gzip更有效,但是速度更慢。bzip2的解压速度比它的压缩速度要快。但是和其他压缩格式比又是最慢的,但是压缩效果明显是最好的。snappy和lz4的解压速度比l...