云计算数据中心里的“哲学”与绿色

2015-04-25 21:40:11

来源
中存储

云计算数据中心里的“哲学”与绿色

使用云计算就是把信息处理任务交付给数据中心（Data Center）去处理。下一代数据中心（Data Center）大多采用虚拟化技术，把一台物理硬件服务器分割成多台逻辑虚拟机，可同时执行多个信息处理任务，使昂贵稀缺的计算资源利用率大为提高。我这年龄段的人都谙熟故主席哲学伟人关于万事都能够一分为二的最高教诲（1957年毛泽东在《党内团结的辩证方法》中明确指出：“一分为二，这是个普遍的现象，这就是辩证法”，《毛泽东选集》第5卷第498页）。所以下一代数据中心（Data Center）里服务器虚拟化做法也就是对服务器一分为二（其实是一分为N）。伟人断言一分为二的普遍性，套用到近日服务器虚拟化情形就是：将一台物理服务器分割成多台虚拟机对于我们通常大多数情况遇到的信息处理任务而言，这是一个具有普遍意义放之四海而皆准的做法，在大多情况下无需特别考虑所要处理任务的性质与规模。的确，在过去的一二十年中，我们一般日常业务的信息处理任务在数量与规模上的增长与GDP的增长，这两者之间应该有一个近似正比例的对应关系。年均增长率10%算是相当高了。可是众所周知同期内IT设备处理信息能力的增长率则远远超过GDP的增速。这就是为何对一个物理服务器做虚拟化分割，一分为二的做法具有一般性和通用性。一般日常业务的信息处理任务，哪怕是比较大规模的，以多租客方式共享使用一台物理服务器，应该没有什么问题。

可是近年来有些种类数据的增长率远远超过GDP的增长率。根据IDC几年前发表的预测，从2006年到今年底，全世界的数据量将增长6倍。到2010年底，大约70%的数据是由个人产生的，而且这些数据中至少85%的部分将由各种组织来负责管理，主要是为数据在安全、隐私、可靠及法规遵从这几个方面进行管理（While nearly 70% of the digital universe will be generated by individuals by 2010， organizations will be responsible for the security， privacy， reliability and compliance of at least 85% of the information）。IDC继续强调：非结构化数据占有这些数据的95%以上（Over 95% of the digital universe is unstructured data）。这些非结构化数据中最典型的就是从网络2.0应用中和大规模移动通信应用中所产生的。所以存储、处理、分析这种2.0数据所需的IT设备能力也必须具有相应的高速增长率。用网络搜索引擎在网上搜索内容就是一个对2.0数据作大规模处理的典型应用。对这种数据处理任务，仅使用一台服务器来处理已经会力不从心，更不要说把一台服务器分割成多个虚拟机来处理多个这样的任务。所以对这一类数据处理问题，一分为二方法不再适用，合二为一才是要领，即：如何将多台服务器联合起来处理解决一个问题。近年来十分热门的map-reduce算法就是把多台服务器连接起来，让它们并行合作解决一个大规模数据处理任务。所以map-reduce能够看作是将数据中心（Data Center）里的服务器“合二（多）为一”。作为一个合二为一的问题，map-reduce算法通常不是跑在一个虚拟化的计算或存储平台上。事实上map-reduce“把计算搬到数据附近”（moving computation to the data）的理念隐含了一个紧耦合计算存储架构：一个数据处理问题的map计算步骤并行发送到许多map workers节点平台上，每一个节点都采用CPU与本地磁盘一一对应的紧耦合存储架构，将处理的中间结果写在本地磁盘上。

我们知道数据中心（Data Center）的服务器如果不采用虚拟化技术，则计算资源的利用率非常低。Map-reduce由于不跑在虚拟化平台上，因而在计算与存储资源的利用上和节电绿色环保方面效率很低。比如想要对非虚拟化的worker节点群实现动态附载均衡是一个很难实现的任务。我们注意到网络搜索引擎具有很可观的碳足迹。有人做过统计：两次Google搜索在数据中心（Data Center）服务器上所耗的电能能够烧开一壶水。如何对数据中心（Data Center）里的合二为一问题实现比较绿色的解决方案，比如在虚拟平台上跑具有动态附载均衡性能的map-reduce，是一个很有意义的研究课题。

声明： 此文观点不代表本站立场；转载须要保留原文链接；版权疑问请联系我们。

云计算数据中心里的“哲学”与绿色

电信互联网数据中心（IDC）的能耗测评方法

数据中心选址：为什么可能不是最佳的方案

未来数据中心新贵十点带你读懂微服务器

百度云计算数据中心的节能和降耗

如何充分考虑云计算数据中心的管理模式

N2W 宣布为 Kubernetes 提供下一级别自动备份与恢复功能

Cloudflare 3周2宕，宕机事件暴露了人工智能和支付依赖的风险

嵌入式安全：嵌入式系统制造商如何通过安全启动密钥管理加强保护

X平台发布全新“Chat”功能，新增端到端加密与视频通话

PostgreSQL 数据库开源接口 pgAdmin4 中发现严重的远程代码执行（RCE）漏洞

Wasabi 推出隐蔽复制功能，提升云存储安全，防勒索软件

HostColor 在迈阿密数据中心推出新的 AI 兼容云和裸机服务器

Inveniam 收购 Storj 为去中心化数据基础设施的未来提供动力

Smash 专为创意社区设计的新服务取代传统文件传输

ASI Solutions 推出 InfiniStor 云存储平台

我国科学家在量子体系中实现突破商业化落地迎关键拐点

江门中微子实验精度提高1.5~1.8倍

2030 年比特币会被量子计算机攻破吗？

NODKA IPC-615H5-Q670利用英特尔的处理和工具集提高性能

LDRA 宣布其 LDRA 工具套件现在支持对多核架构上的时序耦合干扰的增强分析

谷轮赋能中国绿色数据中心建设，打造面向未来的制冷解决方案

美光战略调整，彻底退出消费级内存市场，2026年起停售DDR内存和SSD

电源和冷却限制是未来三到五年人工智能数据中心增长的重大障碍

慧荣科技宣布推出SM8388，业界领先的高能效PCIe Gen5企业SSD主控芯片

Supercomputing 2025：西部数据将展示创新的下一代AI存储

天硕工业级宽温存储方案：智能SLC模式助力关键领域国产化替代

为AI时代打造的 Pure Storage平台，让数据更智能、更快、更安全、更有趣

和硕通过先进的 OCP 解决方案为数据中心的未来提供动力

江苏:县级以下禁止开发政务服务APP

瑞金医院联合华为开源RuiPath病理模型，加速行业智能化落地

科技要闻

Microchip推出数字功率监测器，实现便携式设备测量功耗减半

全球半导体设备市场统计报告：出货量330亿美元，中国占额最大

CISP认证全面介绍，CISP报名条件及培训课程介绍

芯展速“臻·6”发布会圆满礼成国内首发Gen6路标加速「多模态」真正落地

谷轮赋能中国绿色数据中心建设，打造面向未来的制冷解决方案

云计算数据中心里的“哲学”与绿色

猜你喜欢

科技要闻