企业空间采购商城存储论坛

Hadoop

hadoop学习笔记四配置hadoop的eclipse开发环境

、默认项目名称为MapReduceTools，然后在项目MapReduceTools中新建lib目录，先将hadoop下的hadoop-core-1.0.4.jar重命名为hadoop.core.jar，并把hadoop.core.jar、及其lib目录下的commons-cli-1.2.jar、commons-lang-2.4.jar、commons-configuration-1.6.jar、jackson-m

Hadoop安装 eclipse hadoop学习2014-11-24
Hadoop

Netflix基于AWS的大数据平台Hadoop架构解析

Netflix已经把触角深入到大数据工作负载的领域。Netflix是一个“重量级”的Hadoop用户，在2012年6月份Gigaom的记者Derrick Harris就撰文阐述了Netflix如何收集用户的数据，进而使用一些方法来对这些数据进行分析.

Hadoop部署 netflix aws Hadoop架构2014-11-24
Hadoop

Hadoop教程(二)讲解MapReduce用户编程接口

重谈下MapReduce框架中用户经常使用的一些接口或类的详细内容。了解这些会极大帮助你实现、配置和优化MR任务。当然javadoc中对每个class或接口都进行了更全面的陈述，这里只是一个指引教程。

Hadoop安装 Hadoop教程 MapReduce2014-11-24
Hadoop

hadoop常见问题解决

hadoop常见问题解决：WARN mapred.LocalJobRunner: job_local910166057_0001o

Hadoop教程2014-11-24
Hadoop

大数据新手入门hadoop的初步理解

大数据新手入门hadoop的初步理解：hadoop的初步理解 1:hadoop到底是什么呢? hadoop是一个解决方案，是一个能够处理大数据量的的分布式处理系统。

Hadoop安装大数据入门 hadoop原理2014-11-24
Hadoop

hadoop dfs 常用命令行

hadoop dfs 常用命令行：* 文件操作* 查看目录文件* $ hadoop dfs -ls /user/cl** 创建文件目录* $ hadoop dfs -mkdir /user/cl/temp** 删除文件* $ hadoop dfs -rm /us

Hadoop实战 dfs命令 hadoop2014-11-24
Hadoop

国外高级分析师带你深度解读Hadoop与数据仓库概念

在大数据蔓延的今天，传统的数据仓库厂商都为客户做了哪些努力？在本文中，您将了解到如何将现有数据仓库架构的功能发挥到最大，Hadoop的优势与劣势，以及大数据时代中每一个数据仓库厂商的发展等。

Hadoop实战数据仓库2014-10-21
Hadoop

Hadoop教程（一）如何使用Hadoop分析数据

以Hadoop Tutorial为主体带大家走一遍如何使用Hadoop分析数据!MapReduce框架由一个Jobracker（通常简称JT）和数个TaskTracker（TT）组成（在cdh4中如果使用了Jobtracker HA特性，则会有2个Jobtracer，其中只有一个为active，另一个作为standby处于inactive状态）。JobTr

Hadoop安装 Hadoop教程2014-10-21
Hadoop

EMC公司和Pivotal发布数据湖Hadoop2.0包

EMC公司和Pivotal发布数据湖Hadoop2.0包，包括EMC的数据计算设备（DCA），这是一个高性能的大数据计算设备，可大幅简化部署以及扩展基于Hadoop的高级分析计算。

EMC Pivotal 数据湖 hadoop2014-10-20
大数据

微软SQL Server 2008引入Hadoop大数据处理能力

已经发布了早期代码，让客户可以将这个Java架构接入到SQL Server 2008 R2、SQL Server Parallel,微软目前已经开始提供Hadoop Connector for SQL Server Parallel Data Warehouse和Hadoop Connector for SQL Server社区技术预览版本的连接器。

Hadoop安装 SQL Server 2008 微软大数据 windows server 20082014-09-27
Hadoop

YARN成为Hadoop新发力点与Hadoop和YARN的组合有力

YARN本质上是Hadoop的新操作系统，突破了MapReduce框架的性能瓶颈。Murthy认为Hadoop和YARN的组合是企业大数据平台致胜的关键。

Hadoop部署 MapReduce YARN2014-09-27
Hadoop

Hadoop分布式系统的版本和生态圈以及MapReduce模型

Cloudera Hadoop对应Apache Hadoop版本。(1) Apache Hadoop版本介绍Apache的开源项目开发流程 :-- 主干分支 : 新功能都是在主干分支(trunk)上开发;-- 特性独有分支 : 很多新特性稳定性很差, 或者不完善, 在这些分支的独有特定很完善之后。

Hadoop实战 MapReduce模型 MapReduce2014-09-24
Hadoop

六点解读Hadoop版本、生态圈及MapReduce模型

HDFS Federation：NameNode制约HDFS扩展，该功能让多个NameNode分管不同目录，实现访问隔离和横向扩展。。Hadoop版本和生态圈1. Hadoop版本(1) Apache Hadoop版本介绍Apache的开源项目开发流程：主干分支：新功能都是在主干分支（trunk）上开发。

Hadoop教程 Hadoop模型 MapReduce模型 MapReduce2014-09-24
Hadoop

大数据下的逻辑回归训练模型方法论

国内大数据技术服务商百分点公司已将机器学习的相关技术应用到大数据分析中，在百分点合作的某一团购网站，我们选取了10个基于商品和用户的特征属性，结合机器学习中的分类算法，构建了一个基于用户推荐的分类器。

Hadoop Hadoop模型2014-09-24
Hadoop

Hadoop集群部署模型纵览

存储/计算分离模型：将存储节点（Data Node）和计算节点（Task Tracker）部署在不同的虚拟机中，并且根据特定的业务需求，通过相应的分布算法决定集群在vSphereESX物理主机上的拓扑结构。

Hadoop部署 Hadoop模型 Hadoop集群2014-09-24
Hadoop

Pivotal和EMC谈下一代数据湖技术：Tachyon + Spark将极为重要

《数据湖（Data Lake）的未来架构：基于Tachyon和Apache Spark的In-memory数据交换平台》的文章，表达Pivotal与EMC对下一代数据湖技术的展望。

pivotall emc 数据湖 spark2014-09-20
大数据

Hadoop中Zookeeper，HDFS，Hbase，Hive，Pig的概念介绍与比较

Hadoop的框架最核心的设计就是：HDFS和MapReduce、HDFS为海量的数据提供了存储，则MapReduce为海量的数据提供了计算。

Hadoop基础教程2014-09-17
Hadoop

关于hadoop namenode的双机热备份方案详细安装步骤

hadoop-0.20.2没有提供name node的备份，只是提供了一个secondary node，采用drbd实现共享存储，采用heartbeat实现心跳监控，所有服务器都配有双网卡，其中一个网卡专门用于建立心跳网络连接。

Hadoop hadoop备份双机热备 hadoop群集2014-09-06
Hadoop

首页上一页下一页

头条阅读

栏目热点

别人在看

定位“双芯旗舰”，iQOO Neo5新品将于3月16日19:30正式亮相

XSKY连续两年入选Gartner全球分布式文件与对象存储VoC四象限报告

IDC：2020年第四季度全球企业外部OEM存储系统市场收入下降2.1％

看好消费级市场，安全厂商McAfee以40亿美金卖掉企业级网络安全业

关于我们 | 联系我们 | 广告服务 | 合作伙伴 | 网站地图 | 版权声明 | 隐私条款 | 在线投稿

Copyright @ 2006-2018 chinastor.cn 版权所有京ICP备14047533号

中国存储网

存储第一站，存储门户，存储在线交流平台