在数据保护领域三副本大行其道的今天,Bigtera还在坚持用raid5加双副本的数据保护方式,并将其作为主流进行推荐,其原因何在?我们一起来分析一下。
我们先来了解下当前市场上比较常见的数据保护方式:目前比较成熟的数据保护,通常有通过硬件方式的,比如Raid技术,通过Raid卡,将多块硬盘组成一个硬盘组的方式,以达到一块甚至多块硬盘故障也不丢数据的目的,在传统存储阵列中比较常见。随着软件定义存储技术的兴起,数据保护的方式中出现了通过存储软件自身能力提供的如副本,纠删码等形式进行数据保护的方案。所谓副本,就是把一份数据复制成多份进行存储,纠删码则更像一种软件形式的raid5或者raid6,通过多个节点之间数据校验来达到数据保护的目的。当然还有通过双活热备、备份软件备份等多种形式进行数据保护。因为数据保护的方案多种多样,不同的方案又各自有其优势及短板,因此在实际的技术选择应用中客户通常都会问一个问题:哪个最好?
从技术的角度出发,并没有哪个方案最好,只有哪个方案是最合适的。脱离客户需求去谈技术的优劣都是不切实际的,存储的本质是帮助客户保护数据的完整性、安全性,当然同时能够提供高可用更好。此外,还要考虑到存储的总体拥有成本(TCO),因此我们需要从需求的角度出发,帮助客户寻找一套完善、合适且灵活的数据保护方案。
当前分布式存储比较常见的数据保护方案,多采用三副本,即每一份数据写入到存储集群中,均会被复制三份,分别存放在不同的存储节点中。这种方式,很好的保证了数据的安全性,即当有2个节点发生故障时,仍然能够保证数据不丢失。但也存在不足:比如说,对硬盘故障的容错率太低,一旦有硬盘故障,就会立即引起数据恢复导致集群层面的数据恢复。我们知道,当集群规模较大时,硬盘故障发生的概率会非常高,因此,极有可能集群会长时间处于数据恢复状态,而此时集群是非常脆弱的,一旦再发生其他故障,很可能就会发生数据丢失的事故。此外,采用三副本的方案相当于硬盘利用率最多只能达到33%,再加上其他因素,集群的整体硬盘利用率很可能都达不到30%,这无疑增大了整体的成本。
Bigtera选用的raid5加双副本方式,当硬盘发生故障时,依赖raid5的保护此时并不会对集群层面产生任何影响。而IT人员接收到由系统发出的告警信息后,只需要对坏盘进行更换,raid组内数据会自动进行重建,恢复到初始健康状态。就算并没有及时更换硬盘且很不幸该raid组内又有一个硬盘故障时,才会因为该raid组崩溃导致该节点故障,因为我们还有另外一份数据副本,因此也不会发生数据丢失。在大规模的存储集群中,当硬盘故障成为一个高概率事件,raid5的保护显得尤为重要。此外,raid5+双副本的也提供了相对较高的硬盘利用率,降低了存储的总体拥有成本。
以下我们以一个3节点集群,单节点采用4U36盘位设备为例,针对各项指标对比分析如下:
还是像我们之前所说,选择什么样的数据保护方式,最终还是要根据客户的实际需求来定,Bigtera支持多种数据保护技术,能更好的平衡需求与TCO之间的关系,通过专业的技术和方案为用户提供更多的选择。
声明: 此文观点不代表本站立场;转载须要保留原文链接;版权疑问请联系我们。