随着以磁盘为基础的备份装置缓慢但却坚定地取代企业环境中的传统磁带机制,灾难恢复方案的发展前景也出现了剧烈变化。布朗大学的Nancy Magers表示她的团队目前正经历着这样的过渡阶段,希望借此降低硬件成本并从运营层面显著改进数据保护成效。她在SiliconANGLE CUBEConversation的最新一集当中与Wikibon联合创始人兼首席分析师Dave Vellante分享了她在这项工作中的所见所感。
作为位于罗得岛普罗维登斯的一所知名高校,布朗大学在美国各大院校的建校时间排行中位列第七,同时也是闻名遐迩的常青藤联盟的成员之一。担任校方数据恢复与存储副主任的Magers负责维护大学中的相关基础设施,整套环境用于支持并保障全校约两万名学生、教师以及其他工作人员顺利完成日常活动,并在故障发生时处理后续问题。2009年布朗大学开始全盘推广IT现代化项目,由此开始备份与恢复运营的工作内容与任务目标也迎来了更为关键的重要地位。
重新构建数据中心
客观带来的重大挑战之一在于,布朗大学的数据中心已经拥有超过二十年运转历史,而从头开始建立一套新的基础设施在成本上太过高昂。有鉴于此,学校管理层最终认定重新构建数据中心才是最为行之有效的处理手段,但这项工作在执行过程中需要保证终端用户高度依赖的全部关键性任务流程始终处于在线状态。“即使是对于专门处理数据保护工作的我们来说,这样的要求也实在难以完成。这意味着我们需要对基础设施中的所有供电、冷却、地板乃至墙面进行调整,但同时又不能影响到系统的正常运作,”Magers向Vellante解释道。
在此之前,布朗大学一直使用磁带作为备份介质,即在夜间使用量较低时向利用磁带驱动器记录数据、再将这些副本运送至第三方存储供应商处。这种解决方案除了速度缓慢而且价格昂贵之外,其实际效果也不够可靠;因为校方从来没有利用灾难恢复测试来检验保存在外部环境下的信息是否能够及时而全面地满足检索需求。
“我们总要时不时地对某些数据进行恢复,规模较小的备份工作也确实能够顺利进行,但我们从未以全局服务乃至存储在磁带上的数据问题为着眼点审视过这套恢复方案,”Magers进一步分析道。在这样的条件下,数据中心的重新构建工作根本无法展开。在了解情况之后,校方决定拨款以建立一套能够实际快速恢复、并在施工停机期间保障业务全面连续性的应对方案。
Magers和她的团队从零开始,为校方的各位决策制定者耐心作出情况说明并帮助对方了解当前所面临的各项挑战。“我们让他们意识到这项改造工程涉及到大量施工作业,其中必然会出现导致服务中止、切断水流通路乃至其它多种会对日常工作造成严重影响的潜在后果。经过此番交流,他们才真正了解到工程引发服务中断的可能性,”她指出。
接下来的阶段是对日常运转与终端用户生产率可能遭受到的负面影响作出量化。技术团队将总计33套关键性任务应用纳入考查范畴,并根据其各自对停机时长的容忍能力以及校方所能承受的相关数据丢失量对这些应用进行了严格的评估与分级,Magers回忆称。上述工作完成之后,IT部门旋即开始对详细信息加以整理。
改造前、后对比
如今,布朗大学利用EMC的Symmetrix Remote Data Facility(简称SRDF)复制软件对其数据库及主要加以保护,并利用该公司的RecoverPoint连续数据保护工具捍卫其VMware虚拟环境。除此之外,布朗大学现在利用内部网络备份与内部DataDomain重复数据删除方案相结合,从而彻底取代了向第三方供应商配送磁带驱动器的陈旧机制。目前数据会被复制到位于纽约的辅助站点当中,这就确保了当飓风等大规模自然灾害出现时、校方能够拥有可靠的数据恢复效果。
就目前的测试结果来看,布朗大学正常运转所必需的全部33项服务每年都需要接受超过48小时的评估论证周期。“我们会假设灾难已经发生并以此为出发点对这些服务进行测试,整个过程依赖另一套独立网络环境加以实现。我们让用户真正切换到这套独立网络当中,从而难这些服务在备用网络环境下的运行效果以及实际满意程度。因此现在我们已经明确证实这些服务具备可恢复性,既定目标已经达成而且我们的用户也通过客观感受验证了这一结论,”Magers指出。
此次重新构建工程帮助布朗大学降低了基础设施运营风险、节约备份介质使用成本,并且帮助Magers和她的团队得以对校内高达PB级别规模的非结构化数据进行打理。她解释称,如果继续沿用传统解决方案、如此规模的数据内容根本无法备份。也正是基于这一考量,他们才决定选择Isilon向外扩展NAS系统、并利用内置SyncIQ软件以异步方式将信息复制到位于纽约的备用基础设施当中。
声明: 此文观点不代表本站立场;转载须要保留原文链接;版权疑问请联系我们。