一、重复数据删除产品采购前考虑的几大问题:
安全问题:厂商提供的方案是否有潜在的风险,这个问题要自己反复斟酌,不要等着厂商的售前工程师主动“爆料”。
空间占用:究竟去重率是多少,厂商提供的数据是在什么情况下进行的测试,自己的IT环境能否达到这样的去重比率。另外要注意,在去重率已经很高的情况下,再提高,释放的空间是很小的,也就是说,意义不大。
备份、恢复等需要多长时间:是否会影响企业的业务。
成本:我要增加什么,我必须改变成什么,更换设备需要多长时间,是否会影响业务。
最后要仔细研究厂商给出的参数,尤其是有关吞吐量的描述。可能你实测的结果与描述会有不小的差异。
二、源端、目标端去重的选择
重复数据删除的选择最终取决于您希望在哪个环节实现对数据去重,以及您更偏好于在硬件层进行消重还是软件层。所以对选择什么方式没有统一答案。
厂商和产品(W. Curtis Preston在重复数据删除讲义中列出)
•单独的目的端去重
Data Domain、Exagrid、Greenbytes、IBM、NEC、Quantum和SEPATON
•集成在备份软件中的目的端去重
Symantec NetBackup
•集成在备份软件中的源端去重
Asigra、Symantec NetBackup
•单独的源端去重
EMC Avamar、i365 eVault和Symantec NetBackup
•二者的混合
CommVault Simpana
三、在线和后处理去重的选择
在线去重即实时去重,后处理去重即异步去重。W. Curtis Preston在重复数据删除讲义曾列出管理层需要理解的几个概念:
管理层需要了解的在线去重技术
• 当备份完成的时候,去重操作也完成了
• 备份数据一旦写入就开始复制
• 后处理去重方式的厂商需要一个数据准备区域
• 使用后处理去重方式的厂商在备份完成之前不会开始去重操作,因此整个过程会比
在线去重的方式更长一些
管理层需要了解的后处理去重技术
• 当备份完成的时候,去重也基本要完成了
• 当第一份拷贝完成后复制也随之开始
• 我们等待的是一份拷贝的结束,而不是所有备份的结束,除非用户有这样的需求
• 数据准备区域允许我们:
初始备份更快
允许最新的备份和最近的恢复来自本地数据
允许去重交错进行
有选择性的去重
• 其实不一定需要那么多的数据准备磁盘空间
• 在线去重厂商可能会让大数据量的备份和恢复变得缓慢
他们对所有数据都进行了再水化,我们仅仅水化旧的数据
使用在线去重技术的和使用后处理去重的厂商(W. Curtis Preston在重复数据删除讲义中列出)
• 使用在线去重技术
EMC Data Domain
IBM Protectier
NEC HydraStor
• 使用后处理去重技术
Exagrid
Greenbytes
Quantum DXi
SEPATON Deltastor
四、没有测试,神马都是浮云!
在选择合适的去重设备之后,不要以为万事大吉,接下来要进行的事情对所有的问题进行测试。包括去重率、所以的运行速率、整体性能,等等。
重复数据删除是一项非常好的技术,但完整的解决方案对于企业来说更加重要,面对林林总总的产品和厂商,企业的管理者也需要擦亮眼睛,和IT经理一起坐下来认真分析哪种方式和产品更加适合自己的业务。不要花了钱却没有获得多少实际效果。
声明: 此文观点不代表本站立场;转载须要保留原文链接;版权疑问请联系我们。