国外高级分析师带你深度解读Hadoop与数据仓库概念 在大数据蔓延的今天,传统的数据仓库厂商都为客户做了哪些努力?在本文中,您将了解到如何将现有数据仓库架构的功能发挥到最大,Hadoop的优势与劣势,以及大数据时代中每一... Hadoop实战 数据仓库 2014-10-21
Hadoop教程(一)如何使用Hadoop分析数据 以Hadoop Tutorial为主体带大家走一遍如何使用Hadoop分析数据!MapReduce框架由一个Jobracker(通常简称JT)和数个TaskTracker(TT)组成(在cdh4中如果使用了Jobtracker HA... Hadoop安装 Hadoop教程 2014-10-21
微软SQL Server 2008引入Hadoop大数据处理能力 已经发布了早期代码,让客户可以将这个Java架构接入到SQL Server 2008 R2、SQL Server Parallel,微软目前已经开始提供Hadoop Connector for SQL Server Parallel D... Hadoop安装 SQL Server 2008 微软大数据 2014-09-27
YARN成为Hadoop新发力点 与Hadoop和YARN的组合有力 YARN本质上是Hadoop的新操作系统,突破了MapReduce框架的性能瓶颈。Murthy认为Hadoop和YARN的组合是企业大数据平台致胜的关键。... Hadoop部署 MapReduce YARN 2014-09-27
Hadoop分布式系统的版本和生态圈以及MapReduce模型 Cloudera Hadoop对应Apache Hadoop版本。(1) Apache Hadoop版本介绍Apache的开源项目开发流程 :-- 主干分支 : 新功能都是在 主干分支(trunk)上开发;-- 特性独有... Hadoop实战 MapReduce模型 MapReduce 2014-09-24
六点解读Hadoop版本、生态圈及MapReduce模型 HDFS Federation:NameNode制约HDFS扩展,该功能让多个NameNode分管不同目录,实现访问隔离和横向扩展。。Hadoop版本和生态圈1. Hadoop版本(1) Apache Hadoop版本介绍A... Hadoop教程 Hadoop模型 MapReduce模型 2014-09-24
大数据下的逻辑回归训练模型方法论 国内大数据技术服务商百分点公司已将机器学习的相关技术应用到大数据分析中,在百分点合作的某一团购网站,我们选取了10个基于商品和用户的特征属性,结合机器学习中的... Hadoop Hadoop模型 2014-09-24
Hadoop集群部署模型纵览 存储/计算分离模型:将存储节点(Data Node)和计算节点(Task Tracker)部署在不同的虚拟机中,并且根据特定的业务需求,通过相应的分布算法决定集群在vSphereESX物理主机上的... Hadoop部署 Hadoop模型 Hadoop集群 2014-09-24
Hadoop中Zookeeper,HDFS,Hbase,Hive,Pig的概念介绍与比较 Hadoop的框架最核心的设计就是:HDFS和MapReduce、HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。... Hadoop基础教程 2014-09-17
关于hadoop namenode的双机热备份方案详细安装步骤 hadoop-0.20.2没有提供name node的备份,只是提供了一个secondary node,采用drbd实现共享存储,采用heartbeat实现心跳监控,所有服务器都配有双网卡,其中一个网卡专门用... Hadoop hadoop备份 双机热备 2014-09-06
用Hadoop AVRO进行大量小文件的处理 Hadoop NameNode 在内存中保存所有文件的“元信息”数据。据统计,每一个文件需要消耗 NameNode600 字节内存。如果需要保存大量的小文件会对NameNode 造成极大的压... Hadoop部署 2014-09-02
hadoop hive安装教程详解 hive 是Hadoop中最常用的工具,可以说是必装工具,按apache官方文档,推荐使用svn下载后编译,推荐使用tar.gz包,直接安装,很简单搞定hadoop hive的安装。... Hadoop hive 2014-08-25
AIX下安装Hadoop 想知道Hadoop在Aix下的安装是否会有什么不同,于是心血来潮的安装了一遍,过程记录如下:1.在Aix上安装解压缩软件,安装Java等,这里就不说了。2.下载Hadoop0.21.0版本,并解... Hadoop部署 aix 2014-08-18
Hypertable on HDFS(hadoop) 安装 Hypertable on HDFS(hadoop) 安装,安装指南过程4.2.Hypertable on HDFS创建工作目录$ hadoop fs -mkdir /hypertable$ hadoop fs -chmod 777 。... Hadoop实战 HDFS 2014-08-18
hadoop集群环境搭建 hadoop集群规划1.1 共有A、B、C 三台机器;1.2 A 作为master,B作为slave1,C作为slave2;1.3 IP A :192.168.1.103;B:192.168.1.104;C:192.168.1.101;1.创建 hadoop... Hadoop安装 Hadoop集群 2014-08-18
hadoop深入研究:codec codec其实就是coder和decoder两个单词的词头组成的缩略词。使用CompressionCodes解压缩 CompressionCodec有两个方法可以方便的压缩和解压。 压缩:通过createOutpu... Hadoop部署 codec 2014-08-18
Hadoop Summit 2013:Hadoop生态圈格局和趋势 Hadoop被公认是一套行业大数据标准开源软件,在分布式环境下提供了海量数据的处理能力(Gartner)。几乎所有主流厂商都围绕Hadoop开发工具、开源软件、商业化工具和技... Hadoop安装 Hadoop 2014-08-18
Erasure Code为Hadoop节省数据恢复带宽 大约十年前,业界开始采用 Reed Solomon code对数据分发两份或三份,替代传统的RAID5或RAID6。由于采用了廉价的磁盘替代昂贵的存储阵列,所以这种方法非常经济。Reed S... Hadoop实战 Erasure Code 2014-08-18