数据中心环境监控的几个角度

2015-03-08 07:54:29

来源
机房360

数据中心

在数据中心环境监控当中我们有什么需要注意的呢？下面是有关于数据中心环境监控的几个角度。管理告警。正常运行时间和能效是衡量环境监控的标准。因为查找错误，或提前检测来预防故障是数据中心（Data Center）的关键任务。管理良好集中的系统能让管理者很快应对紧急事

数据中心环境监控的几个角度

1、通过其他传感器整合环境。温度和试读/液体传感器只是智能数据中心（Data Center）环境监控的起步。很多地方需要消防警报。这些警报通常连接了建筑的灭火系统，它们也能够被整合进数据中心（Data Center）监控系统，让管理者发现火警立刻采取行动。

同样也要用PDS（电力分配系统）监控能源，然后整合所得数据。能源监控能够支持持续评价数据中心（Data Center）PUE，帮助IT部门尽早介入能源错误。有的数据中心（Data Center）还检查整合智能UPS系统的数据，还能追踪UPS电池和告警情况。

房间和机架通行传感器能够查出哪些人未经授权进入机房，在必要的时候还会召唤保安。至少简单的物理传感器能够记录开关门情况，缩小在特定时间的人员进出范围。

2、管理告警。正常运行时间和能效是衡量环境监控的标准。因为查找错误，或提前检测来预防故障是数据中心（Data Center）的关键任务。管理良好集中的系统能让管理者很快应对紧急事件，保持高度正常运行。创建中心告警系统也对数据中心（Data Center）正常运行有很大意义。好的告警系统能够优先处理关键问题，对后果最严重的潜在时间优先对待。当配置好告警系统，要评价和指定每个报警对于业务和操作的影响。

3、远程数据中心（Data Center）监控。远程监控能帮助组织时刻注意他们的后背环境，或者把监控管理工作外包出去。观察远程设施健康状况的能力能帮助IT管理者对紧急时间做出更快的回应，使环境回复正常。

数据中心（Data Center）监控的最佳实践

记住：数据中心（Data Center）监控架构需要定期维护和测试——就像任何设备一样。另外，适应数据中心（Data Center）的进化，不要把传感器放好了就不管。这里有一些关于数据中心（Data Center）环境监控的实践。

1、测试和维护。所有传感器都得定期测试维护。不稳定或有问题的传感器必须及时替换。有一种测试方法是看其他类似传感器的报道。当一台机架内几个传感器报告同时报告同样温度，但是有一个传感器却与其他相异，那就得检查了，当然你也得看看是不是机架本身有问题。

2、随时准备面对紧急状况。传感器本身不能防止紧急状况发生，所以你还要做好常规的计划。灾难恢复计划就得包含在内。你得知道数据中心（Data Center）运维团队是哪个，如何最快找到他们。当发生制冷故障，你得先找HVAC工程师。还得仔细描述问题。说道紧急故障，那可真是分秒必争。

3、准备好后备计划。监控系统能设置不同级别的告警。如果数据中心（Data Center）是在托管环境，就得在服务级别的合同中指定紧急状况。托管商必须有意外事故的计划，以面对突然发生的问题。在私人数据中心（Data Center）里，总有传感器监控和告警系统运作。制冷装置可能会在紧急状况发生时保证本地后备部件——即使这意味这是用临时便携制冷设备。

4、自动化恢复计划。有的监控系统整合了自动系统。一旦发生单独的机架事故，有的系统能关掉不必要的服务器。开发服务器通常好点很大，却不用在正常产品过程中运行。任何测试服务器如果不是必要的，都能够在紧急情况中关掉。

随着数据中心（Data Center）进化，IT经理应该发掘更多自动化工具，来帮助环境长久运转。物理架构管理的自动化和中心化是数据中心（Data Center）设计运维的下一步。关键仍然在于策略性地保持正常时间。提前做好机房监控，IT管理员能够减少大量宕机危险。

声明： 此文观点不代表本站立场；转载须要保留原文链接；版权疑问请联系我们。

数据中心环境监控的几个角度

电信互联网数据中心（IDC）的能耗测评方法

IDC时评：从开放中走来的腾讯数据中心

IDC时评：动态存储将有助数据中心转型

机房布线技术之光纤应用技术分析

未来数据中心布线系统的五个趋势

新型 Linux Rootkit PUMAKIT 使用先进的隐身技术躲避检测

OpenAI就ChatGPT宕机致歉：部分服务恢复，Sora仍处于瘫痪状态

N-able 收购现有战略合作伙伴 Adlumin

美方指控“与中国有关黑客”入侵多家电信公司网络，外交部驳斥

IDC：英方软件第九次获中国专业灾备软件厂商第一

阿里云盘回应相册陌生照片“乱入”问题：已快速修复，用户影响面较小

Backblaze：如何扩展公司的云存储？

以色列初创企业Datafy在种子轮融资600万美元

Cloudflare宣布R2的主要更新，包括事件通知和GCS支持

IDrive Backup新功能：云对云备份Google数据

60国签署巴黎AI峰会声明，美英缺席

富士通横滨国立大学使用 Fugaku 超级计算机推进台风龙卷风预报

Jülich 购买 D-Wave 量子计算机加强量子研究

Trane 将液体冷却集成到 AI 和 HPC 的热管理中

D-Wave 宣布举办 Qubits 2025 量子计算用户大会

Trendfocus 磁带和归档存储服务 CQ3 '24 季度更新报告

适用于 IBM Spectrum Scale 的联想分布式存储解决方案

CES 2025：威刚/XPG Schowcasing 工业和游戏存储设备

AI推理将驱动AIDC需求提升数据中心行业有望复苏

美光采样 6550 ION PCIe Gen5 高达 61TB 的 E3 数据中心 SSD

中国信通院发布《智能化医疗装备产业蓝皮书（2024年）》

使用 Ardis DDP10EF 和 SupremeRAID SR-1000 for M&E 解锁更高水平的媒体性能

多地点运营的企业，分布式管理与集中式管理哪种更具有网络保护的优势？

数字政府一体化建设白皮书（2024年）

Orico公司联合西部数据推出面向创作者的混合存储产品

科技要闻

IDC 发布《FutureScape 2025 年全球制造业预测 – 亚太地区（不包括日本）影响》报告

60国签署巴黎AI峰会声明，美英缺席

一月手机激活量统计数据出炉：华为领跑，小米崛起，苹果失速！

Nasuni 2024年财报创纪录

慧荣Silicon Motion公布24 财年第四季度财务业绩

数据中心环境监控的几个角度

猜你喜欢

科技要闻