MapReduce中多文件输出的使用的两种方法总结 在Mapreduce 的程序设计中,有时候会遇到多文件输出的使用,目前总结为两种方法:第一种方法:使用MultipleOutputFormat,第二种方式:使用MultipleOutputs。... MapReduce 2015-07-17
Hadoop中的数据库访问 讲述如何将Hadoop与现有的数据库结合起来,在Hadoop应用程序中访问数据库中的文件。DBInputFormat和DBOutputFormat提供了一个访问数据库的简单接口,虽然接口简单,但... Hadoop 2015-07-17
介绍Hadoop的元数据服务HCatalog 作为Hadoop的用户,对元数据目录的需求是明确的。HCatalog作为Hadoop集群的元数据服务,其价值可以媲美数据库管理系统 (DBMS)。虽然这一点目前还在研究中,但仍有必要... Hadoop实战 Hadoop元数据 2015-07-17
盘点九款Hadoop商业发行版的创新之路 当下各大顶尖商业发行版都与Apache Hadoop相兼容,那么它们彼此之间如何保持独立性?AWS的Elastic MapReduce(简称EMR)则确实是最早投放市场的商业Hadoop产品之一,Clo... Hadoop安装 Hadoop版本 2015-07-17
大数据不单单只是Hadoop 这段时间接触大数据相关项目比较多,自然有些体会和感触。认识到:大数据不单单只是Hadoop,比如Mongo DB也可以做MAP/Reduce的工作。Hive能够为Hadoop体系提供SQL的接... Hadoop教程 大数据 2015-07-17
Hadoop峰会:Hadoop业务成果新探讨 Hadoop业界一直将业务成果作为主要关注对象,关于Hadoop业务成果的新探讨应当成为昨天由Jeff Frick以及John Furrier共同主持的theCUBE研讨环节的核心内容。... Hadoop峰会 2015-07-17
Talend为Hadoop更新开源大数据平台,性能大幅提高 根据22个标准 TPC-H 测试结果显示,新版本能够将Hadhoop的性能和可扩展性提高45%,速度提升的部分功劳还要归功于Talend Data Mapper——这是一个数据映射工具,现在主... Hadoop教程 Talend 开源大数据 2015-07-17
Hadoop:稳定、高效、灵活的大数据处理平台 什么是 Hadoop呢?简单地说, Hadoop是一个能够对大量数据进行分布式处理的软件框架。首先,它将大量的数据集保存在分布式服务器集群中,之后它将在每个服务器集群里运... Hadoop教程 2015-07-17
巧妙利用Hadoop大数据处理功能 当谈论到使用多种NoSQL和Hadoop的方法解决真实世界问题时,Tomlinson,谈论了一个很有意思的案例,此案例中,通过在健康保健专业人员的徽章中使用射频识别技术,收集了关于... Hadoop安装 2015-07-17
搭建Hadoop数据库,所有的鸡蛋不能放一个篮子 本文作者,对于Hadoop能够、并且应该成为企业所有分析数据的中心枢纽这一观点持怀疑态度。在Hadoop时代,单一的“企业数据枢纽”这一理念依然会存在反对的声音。... Hadoop安装 2015-07-17
什么是Hadoop? 什么是Hadoop?Hadoop框架中最核心的设计就是:MapReduce和HDFS。HDFS是Hadoop分布式文件系统(Hadoop Distributed File System)的缩写,为分布式计算存储提供了底层支... Hadoop教程 什么是Hadoop 2015-07-17
Hortonworks的首次收购给Hadoop安全开了个好头 是Hortonworks希望通过收购XA Secure公司在分析周期当中严格执行数据保护。事实证明,传统的附加型解决方案并不足以抵御当下企业所面临的实际威胁,在处理敏感数据的... Hadoop部署 Hadoop安全 2015-07-17
Hadoop作业的生命周期 下面的图就是一个Hadoop作业运行的生命周期,在接下来的文章中,会详细分析每一个步骤的设计思路和源代码的详解,这张图真正的吃透了,Hadoop也就学会了。... Hadoop教程 2015-07-17
Hadoop的效能管理--数据篇 Hadoop的user多半是因为它的High availability和scalability能,而投向它的怀抱(当然,免钱也是个大家"心照不宣"的重要因素)。不过,一家公司究竟该有几隻大象服务才够... Hadoop安装 2015-07-17
Hadoop峰会:Cloudera与Hortonworks谁能一骑绝尘? 今年Hadoop峰会上的最大讨论热点之一在于Cloudera与Hortonworks这对知名度极高的竞争对手之间的比拼与竞逐。目前随着市场的成熟,双方的对抗已经趋于白热化,而Cloud... Hadoop实战 2015-07-17
分析微软HadoopOnAzure的大数据处理功能 在大数据技术中,Apache Hadoop和MapReduce是最受用户关注的。但管理Hadoop分布式文件系统,或用Java编写执行MapReduce任务则不是简单的事。那么Apache Hive也许能帮... Hadoop 2015-07-17