数据存储也“低碳”——重复数据删除设备采购
企业采购
尽管今天企业数据存储的成本不断降低,但企业需要存储或者备份的数据量仍然持续上涨,导致企业在存储设备上的投入不断增加。是否能有一种技术或解决方案能够10倍甚至100倍地缩减企业的冗余数据,让数据备份在容量空间方面的成本能够被更多的企业接受呢?
重复数据删除技术正是近期非常热门的技术,由于它可以大幅度压缩和删减用户需要备份的数据量,因此企业用户对它青睐有加。基于企业的不同业务数据类型和备份模式,企业在备份过程中,通常会保存大量的不需要的冗余数据,重复数据删除技术可以删除这部分冗余数据,从而大幅度降低企业数据存储和备份对容量空间的需求。一些备份技术专家建议:任何拥有大量数据的企业都应该使用,或者至少尝试一下重复数据删除设备。
青睐重复数据 删除设备的理由
提到重复数据删除技术,首先得说说冗余数据。冗余数据是指重复的数据,也可以说是存储在不同数据文件中的同一种数据。以高考为例,全国数十万考生、数十万份答卷,如果以数字化形式单独存储每个考生的每份答卷,数据存储量十分巨大,如果我们将考生答卷的相同数据(如考题、标准答案等模块化数据)统一存储,而每个考生的目录下仅存储考生信息及考题答案等独立的不同数据,那这样数据存储量将大大降低,在这里考生答卷的相同数据部分即为冗余数据。
重复数据删除技术的工作过程为“数据收集→识别比较→数据重组→完整性检查→空间回收”,该技术诞生的初衷便是为消除庞大数据库中的冗余数据,压缩需要存储的数据,减少存储设备的存储压力,提高数据的网络传输效率,降低存储设备能耗,达到节能减排的目的,使企业存储设备“低碳”运行。一般来说,执行重复数据删除有两种形式:软件、硬件。我们这里谈的重复数据删除设备是指具有大范围、大规模、大压缩比的重复数据删除功能的硬件产品。
●存储介质投入少,存储“低碳”
10TB左右的海量数据,经过重复数据删除技术高达20:1甚至200:1的压缩比率整理压缩后,只需要500GB甚至50GB左右的存储空间即可轻松容纳,通过重复数据删除技术,用户可以在已有的磁盘或磁带存储设备上存储更多的备份数据,减少对大容量、高价格数据存储介质的依赖,降低采购成本。
●数据传输带宽小,网络“低碳”
近两年发展速度很快的云计算技术在运算过程中会产生海量数据,这部分数据绝大部分依赖网络传输实时复制,这对企业网络构成了极大的压力,而数据通过重复数据删除技术优化后,只传输压缩的数据,可降低对企业网络带宽的压力,降低网络带宽成本。
●节约空间发热少,后勤“低碳”
无论是云计算还是传统的数据备份,最终产生的海量数据都需要一个庞大的数据中心来存储整理,数据中心的正常运转不仅需要大量的电力,需要寸土寸金的楼宇空间,还要有致冷设备等,数据中心运营价格不菲,试想如果这个数据中心能缩减到原来的5%,企业的后勤保障成本会降低多少呢?
当然,凡事皆有两面性,重复数据删除设备在具有以上优势外,也有自己的“软肋”,比如使用重复数据删除设备会使备份数据速度减慢,备份数据损坏后难以恢复,作为企业CIO要认真权衡抉择。

案例1:存储压缩
秦山石油化工公司是一家业务偏重于终端零售销售的柴汽油分销公司,其境内管理有2300多家加油站,2万多台加油机终端,日均客户120余万,日销售额4000万元以上,财务计算机系统详细记录各加油站客户的加油时间、数量、金额等信息,根据实时信息计算各加油站油量剩余、安排油料运输及结账。每日汇总到数据中心的油料信息、员工信息、客户信息多达约40GB,日积月累,企业数据中心存储的历史数据呈几何级增长,众多冗余数据急切需要使用重复数据删除设备加以整理备份。
推荐产品1:IBM TS7650 ProtecTIER
特点:高可靠性,是包含服务器的整体解决方案

IBM TS7650 ProtecTIER实际上是一整套数据存储解决方案,它整合IBM服务器、存储及IBM ProtecTIER重复数据删除软件,部署简单,可轻松与现有备份环境兼容。IBM TS7650 ProtecTIER采用IBM独有的专利算法HyperFactor解决冲突问题。IBM TS7650 ProtecTIER 拥有已获专利的模式识别算法,可减少高达 25倍的冗余数据存储,从而彻底降低成本。设备高达 500MB/s的持续内置吞吐量,完全可应对最严苛的数据中心要求。通过扩展存储设备容量可至1PB,通过重复数据删除技术可为超过 25PB 的备份数据提供存储空间。该解决方案有四种配置可用,以满足从中等 IT 环境到企业数据中心的各种机构组织使用。

推荐产品2:戴尔 PowerVault DL2000
特点:简单易用,包含重复数据删除系统和存储系统

戴尔发布的PowerVault DL2000也是一款完整的数据存储解决方案,它包括了基于数据块级别的重复删除技术,提供端到端备份、存档和复制技术,是业内不多的集成硬件、软件和服务解决方案的产品,并预装了方便用户管理使用重复数据删除及存储等功能的CommVault Simpana 8.0软件。PowerVault DL2000可以实现20:1的重复删除数据比例,这种功能可以使企业以经济的方式在很小的磁盘空间里保存完整的数据以恢复备份。
案例2:容灾备份
北国商业集团在某省内十数个城市拥有18家大型商场,总经营面积70余万平方米,年销售额近100亿元,在集团客户数据备份方面一直采用本地备份的数据保护模式。在一次数据中心火灾事故中,企业客户数据损失惨重,众多VIP金卡客户无法刷卡,数十万现金卡数据清零,上万消费者的积分惨遭清空,公司不得不拿出巨额资金善后。究其原因,其关键业务数据缺乏完善的保护机制,为确保不再发生类似的数据丢失灾难。企业管理层提出将关键数据异地备份保护,确保在本地业务数据丢失后,使用保存在异地的关键数据,及时迅速恢复运营。
推荐产品1:昆腾Quantum Dxi3500
特点:老牌备份厂商,昆腾DXi系统在国内应用广泛

针对要保护的数据介于1.2 TB到 4.2TB设计,昆腾Quantum DXi3500提供了快速可靠的备份和恢复,并且使 WAN广域数据远程容灾系统成为灾难恢复规划中一个经济、可行的部分。它使用户可以保留在磁盘上的备份数据量提高了10 倍到50倍,当用户使用Quantum DXi3500 进行容灾备份时,用户可以将数据从一个或多个站点传送到中央位置,复制数据作为后台进程运行,不影响客户的其他工作。Quantum Dxi3500能轻松部署到企业的现有网络中,对于使用ADSL宽带网络的中小企业,仅利用一条2Mbps宽带专线,即可完成每天多达100GB的远程容灾数据备份。
推荐产品2:Data Domain DD510
特点:存储新秀,产品获得众多专业厂商青睐

Data Domain是重复数据删除设备厂商中比较年轻的一员,但其性能强大的产品受到众多专业厂商的欢迎。Data Domain DD510 为3U标准机架设备,内部包含可热插拔的磁盘及冗余冷却风扇,其标配容量为2.25TB,最大可用空间为1.5TB,通过使用重复数据删除技术,其最大可用备份数据容量至少为30TB;其背部的双千兆以太网端口支持在线处理,可以进行数据远程复制,数据传输最高速度为290GB/小时。
推荐产品3:飞康FDS
特点:为多家存储厂商提供软件,系统兼容性好

飞康FDS,一机四用,集网络备份磁盘柜、重复数据删除管理器、备份服务器、异地备份服务器于一体,即插即用,不会改变用户的IT环境。飞康将自己的软件产品以解决方案的形式OEM给IBM、DELL、EMC等老牌存储厂商,它新推出的飞康FDS 2.0自称为全球首款支持高可靠性的LAN-Based重复数据删除设备,可确保数据备份操作不受硬件故障或网络中断的影响,确保低带宽环境异地集中备份,保阵容灾备份数据的安全性。飞康FDS备份速度高达200MB/s ,可节省10~20倍的存储空间,可减少95%异地备份网络的带宽占用,支持多对一远程集中备份。
