存储虚拟化渐行渐近
行业观察
当今信息社会,人们对信息数据的需求越来越大,导致存储系统的规模变得愈加庞大,这种信息资源的高速增长对存储系统的可靠性和扩展性提出了挑战,信息资源的共享显得越来越重要。在广域网中存在大量相互独立的数据孤岛,它们之间不能进行资源共享,存储空间不能得到有效使用。对许多数据中心用户来说,目前最急需处理好的问题是如何在存储架构中进行海量数据的存储,特别是如何提高数据存储性能和数据利用率,于是企业用户开始将目光转到存储虚拟化技术上。
弄清存储虚拟化的含义
虽然存储虚拟化在市场上叫卖的声音很高,但是由于目前没有统一的标准,一部分企业用户对它并不清楚。如果一定要给存储虚拟化下一个定义,那么我们不妨参考SNIA(存储网络工业协会)对它的解释:通过将一个或多个目标(Target)服务或功能与其他附加的功能集成,统一提供有用的全面功能服务。通俗点说,所谓存储虚拟化,就是把多个存储介质模块(如硬盘阵列、磁带库等)通过一定的技术手段集中管理起来,所有的存储模块在一个存储池(Storage Pool)中得到统一有效的管理分配,从主机和工作站的角度,看到就不是多个存储器,而是一个存储卷,就好像是一个超大容量的硬盘。这种可以将多种、多个存储设备“集中”起来统一管理,为使用者提供大容量、高数据传输性能的存储系统,就称为存储虚拟化。
对于一台计算机来说,虚拟存储管理系统就像计算机中的操作系统,对下层管理着各种特殊而具体的设备,对上层则提供相对统一的运行环境和资源使用方式。逻辑卷与物理实体之间的映射关系,是由安装在应用服务器上的卷管理软件(称为主机级的虚拟化),或存储子系统的控制器(称为存储子系统级的虚拟化),或加入存储网络SAN(存储域网络)或FAN(文件区域网络)的专用装置(称为网络级的虚拟化)来照管的。即使物理存储器发生变化,这种逻辑映像也不会改变,系统管理员不必再关心后端存储,只需要专注管理存储空间,所有的存储管理操作,如系统升级、建立和分配虚拟磁盘、改变RAID级别、扩充存储空间等都比以前容易得多,存储管理变得轻松简单。
在存储虚拟化应用层面上,主机级和存储子系统级的虚拟化都是早期的、比较低级的虚拟化方案,因为它们不能将多个异构的存储子系统整合成一个或多个存储池。而网络级的虚拟化,则能将存储网络上的各种品牌的存储子系统整合成一个或多个可以集中管理的存储池(存储池可跨多个存储子系统),并在存储池中按用户需要建立一个或多个不同大小的虚卷,并将这些虚卷按一定的读写授权分配给存储网络上的各种应用服务器,从而达到充分利用存储器容量、集中管理存储器、降低存储成本的目的。
存储虚拟化的价值
今天,企业存储设备已经发展成具有复杂功能的存储系统,但企业用户不再仅仅关心存储系统的容量和性能,更多的是关心功能和管理能力。虽然目前存储虚拟化没有标准可言,各家的定义也不尽相同,但是存储虚拟化的根本目的很明确:就是让管理方式和应用工具都变得更加简单和廉价。比如电信或银行用户,他们大量的异构数据需要迁移到新平台上,怎么办?如果没有存储虚拟化技术简直不可想象,而借助存储虚拟化软件,这个问题可以迎刃而解。
1.消除信息孤岛、降低成本
存储虚拟化技术可对不同结构的存储设备进行集中管理,用户可以将存储设备集中在一起形成一个存储池,一个存储池中的所有存储卷都拥有相同的属性,让存储架构变得简单和廉价。比如进行存储虚拟化后,存储系统由单一化向多元化发展,存储架构由多个“SAN孤岛”变为“SAN统一”,并可以随时提取当前的业务数据进行分析、再加工和备份保护,而不会影响到生产数据。存储虚拟化使用户可以与存储资源中大量的物理特性隔绝开来,就好像我们去仓库存放或提取物品时,只跟仓库管理员打交道,而不必去关心我们的物品究竟存放在仓库内的哪一个角落,从而提高存储设备的整体利用率。另外,存储虚拟化可以有效降低系统管理成本——这一点主要体现在利用存储虚拟化技术,可将不同存储应用分级,让整体存储TCO(总所有成本)降低25%。比如你的企业在各地有接近20台的NAS(网络附属存储)系统与文件服务器,应用存储虚拟化技术,能统一管理所有存储设备,虚拟化所带来的效益就很显著。
2.消除数据热点
存储虚拟化另一个吸人之处是可以消除数据热点,提升存储系统的性能与可用性。性能与可用性是客户选择存储设备产品时的关注点之一。尤其中高端存储阵列一般用于运行数据库和文件系统,一旦出现“数据热点”,便会严重影响应用性能。“数据热点”形成的主要原因是磁盘的I/O吞吐量过高,如果每秒内同一磁盘的数据吞吐量过高,磁盘阵列的性能便会有所下降。与传统存储阵列相比,存储虚拟化技术独特的设计使磁盘阵列在性能和可用性方面具备非常强的优势,比如它能够自动执行大部分任务,不但降低了复杂性,还实现了更高的性能和可用性,大大节省了存储管理员的时间。磁盘阵列RAID组的性能与它所包含的磁盘数量有关,磁盘数量越少,则性能越差。而借助存储虚拟化技术,存储管理员能够轻松地管理磁盘阵列,他们无需制定复杂的决策,例如磁盘分配、RAID组构建与部署、备用和性能管理等,能够根据优先顺序对I/O要求进行排列,还具备预读功能,能够更改磁盘访问,从而更高效地使用磁盘组上的资源。大多数传统磁盘阵列都不具备上述这些特性。
存储虚拟化市场硝烟弥漫
目前各大服务器提供商正在遵循简化IT管理的理念,致力于为企业用户提供具有各自特色的存储虚拟化方案。现在市场上的存储虚拟化产品,LSI的SVM(存储虚拟化管理器)、IBM的SVC(SAN卷控制器)、HDS的TagmaStore都可以算是比较成熟的产品。其中,LSI所推的SVM是网络层存储虚拟化的代表,采用带外(Out-of-Band)设计原理,而IBM的SVC采用的是带内(In-of-Band)设计原理,目前业内争论最激烈的话题就是采用带内还是带外方式。
1.IBM:存储虚拟化领域全面开花
作为服务器领域的龙头老大,IBM一直致力于服务器领域的虚拟化方案的开发及推广。在存储虚拟化方面,IBM的Total Storage SAN Volume Controller(SAN卷控制器,以下简称SVC)和Total Storage SAN File System(SAN文件控制器,以下简称SFS)以其卓越的性能给存储业界带来了革命性的变化。
IBM SVC为In-of-Band产品(也称对称虚拟),是模块化结构,可以由多个Cluster节点组成,每个节点有大的Cache和高性能的处理器,位于存储器和主机之间,可以把不同的存储设备组成一个大型的存储池,其中若干存储设备以一个统一的逻辑设备存在,可以被系统中所有服务器访问,防止存储设备出现信息孤岛。IBM SVC的另一个优点是具有较高的安全性,黑客很难侵入。但是从服务器层面看,带内存储会占用较多的数据网络带宽来传输控制数据,因此容易在服务器和存储设备之间产生性能瓶颈。值得注意的是,SVC是为一个完全开放的存储环境设计的,对服务器和存储设备都是透明的,为各种不同的存储设备提供了一个统一的数据复制平台,可以兼容各种不同的存储设备。
IBM SFS为Out-of-band产品(又叫不对称虚拟),虚拟存储控制器处于系统数据通路之外,是基于Linux设计的高性能集群Server,在数据通路外的服务器上实现的虚拟功能,也就是将控制数据和存储数据安排在不同的数据通路上传输,不再经过虚拟存储控制器,从而达到了增大传输带宽的目的。这种方式减少了存储数据网络中的流量,有助于提高系统性能,但是一般需要安装专用软件,也容易受到攻击。
2.LSI:SVM将控制信息和数据信息分离
LSI所推的SVM虽然与IBM的SVC仅一个字母之差,但两者的实现方式有着本质的区别。SVM采用带外(Out-of-Band)设计原理,是一种分离数据路径的架构,它将控制信息和数据信息分离并赋予虚拟化设备多个路径,SVM服务器只是负责定向数据访问路径,而不用处理数据流,对硬件配置的要求不高。SVM的这种设计原理,使得数据路径不会像IBM SVC那样参与数据的处理,能够避免出现I/O瓶颈的问题。不过SVM也存在着一定的不足,比如在最大数据管理量方面,LSI最新推出的SVM 5的最大可管理数据量为2PB,而IBM SVC则达到了惊人的8PB,虽然说数据管理不能够用最大数据管理量来衡量,但是面对数据量的爆炸性增长,更高容量的管理能力无疑能吸引企业客户。
3.HDS:级联加外挂扩充存储容量
HDS也是存储虚拟化市场上的领军人物之一,它的HDS TagmaStore通用存储平台是当前市场广受欢迎的存储虚拟化方案之一。TagmaStore是基于存储设备的虚拟化产品,它最大的特点是除了可以通过机柜的级联实现容量的扩展外,还可以通过外挂不同型号的存储设备来扩充存储容量。这些外挂的存储设备既可以是HDS公司其他系列的产品,也可以是经过测试的其他厂商的存储设备,这样便于用户实现在异构环境下的存储及应用整合,从而降低了存储管理的复杂度。对于企业用户来说,方便的容量扩充、简化的异构环境管理以及灵活的分级存储是TagmaStore最吸引人的地方。br>

