文件虚拟化是不同的限制条件来分离文件数据。
定义
文件虚拟化可以让用户根据各种不同的限制条件来分离文件数据,例如数据的读取及管理方式等。传统的文件服务器 采用这种技术可以具备更多的功能,还可以摆脱只能用CIFS或者NFS读取文件的限制,而原来这些功能只在网络附加存储(NAS)设备上才能实现。在实际 工作环境中,用户可能会遇到各种各样的限制。致命的是,如果客户数据和公司内部的数据放在同一个访问目录下,用户想移动某个文件或者目录就会变的非常复 杂。
文件虚拟化可以掩饰用户读取文件的方式,这样用户就可以在客户不受影响的前提下放心的移动和管理自己的数据文件。 文件虚拟化同样适用于那些存储架构增长较快并且数据读取较为频繁的用户。文件虚拟化还可以使迁移
存储系统变得更为简单。这就是现在市场上有种类繁多的文件
虚拟化软件的原因。
文件虚拟化可以部署为一台设备或者一台运行文件虚拟化软件的现成的服务器。这种选择基本上是根据成本以及有关的管理和破坏水平确定的。最常用的部署选择是设备。这种设备有四种不同的架构:带外、带内、这两者的结合和分离路径(Split-Path)。
并为所有的文件虚拟化部署从长远看是成功的。有些机构也许会退回(撤销)他们的部署。这对于文件服务器和网络附加存储平台来说是一个破坏性非常大的过程。在极端的情况下,退回可能需要机构卸载数据、删除文件虚拟化层,然后重新格式化和重新装载全部数据。经销商通常能够帮助识别潜在的退回问题,提供减轻破坏的建议。用户在一般部署之前通常要测试其退回的程序。
文件虚拟化受到可伸缩性的限制。可伸缩性包括文件系统、文件、服务器或者输入/输出性能。文件虚拟化平台还必须要兼容当前的基础设施。这样,它就能够与现有的存储系统和交换机一起工作。要防止出现潜在的问题,文件虚拟化平台应该经常进行适当的可伸缩性和兼容性测试。
类型
大部分厂商的文件虚拟化产品都具备我刚才所谈到的特性,当然它们还有一些其它的特性。刚才提到的特性在 Taneja Group被称为网络
文件管理系统。采用文件虚拟化后,不管是在NAS存储中增加一个内部设备还是将
外部设备整合到NAS存储中去都变得非常方便。用户可 以使用这种方式把客户的数据与内部的数据分离开来,然后再转移数据或者做其它操作就非常方便了。文件虚拟化大部分时候被用作网络
文件管理系统。
用户对性能要求及操作文件的密度要求决定了哪些方案适合做文件级别的虚拟化和哪些方案适合做目录级别的虚拟化。基于文件的虚拟化可以实现文件级别的虚拟,这种情况下,用户是否需要更高的性能取决于应用是in-band(带内)还是out-of-band(带外)。
不管是使用文件级别还是目录级别、in-band还是Out-of-band,用户都可以找到多种选择。通常情况下,在使用in-band和文件级别的虚拟化时会有3到4种的方案可供选择,而out-of-band和目录级别的虚拟化暂时还不能同时使用。
有些技术也许只是对定期的
数据迁移比较实用,对其他的任务则并不奏效,这样用户还需要花费额外的时间来管理数据。而这种技术不同,它可以永久的实现环境的虚拟化,不再需要增加其他额外的技术。
不要将文件虚拟化跟全局命名空间混为一谈。全局命名空间可以让用户在同一个
挂载点访问不同的文件和目录,这样就省去了在NAS 系统和客户端分别配置存储的麻烦。
主要影响
这取决于用户的实际情况。文件虚拟化可以利用多种方式与文件服务器交互。有时需要与NAS API结合才能把客户的请求重新定位到已改变位置的数据上。用户复制或者迁移文件的方式会影响环境的复杂性。如果有些数据依赖与你的文件系统或者有些工具 只能在这个文件系统上运行,那么就不应该用常规的方式来对这部分数据进行迁移或者复制。这时用户需要认真考虑是否要在自己的环境中加入这些新技术。
如果用户在in-band中使用了文件虚拟化,系统就会出现一些延迟。这时用户需要注意,在处理故障切换和新
数据迁移时可能会出现问题。在复制和迁移时也会存在上面的问题。
可以使用这些技术来进行
数据迁移,但是如果用户使用的复制和迁移技术与这些新技术有冲突的话,那问题就很严重了。所以一定要考虑周全后才可以在生产环境中使用这些新技术。
优劣
文件虚拟化通常要跟存储设备结合在一起,通过将合适的数据放在相应的层上来达到简化存储管理和优化存储的目的。采用这项技术可以的大大简化存储的基础架构并且可以虚拟出更多可用空间,这样就可以降低对数据进行迁移的次数。
在此之前,如果用户的文件系统已经占据了95%的硬盘空间,用户必须尽快进行
数据迁移。而现在用户可以采用文件虚拟化来转移一部分数据,避免匆忙的进行
数据迁移。总而言之,采用文件虚拟化之前要整体全面的考虑存储架构。
前面我提到过,采用了文件虚拟化以后,在复制和迁移数据时可能会出现性能问题,但也可以采用一些方法来消除它们。如果用户想把所有的文件进行粒度分层,也许会发现对文件进行重新分层是非常困难的。用户需要长远的去考虑这些问题,肯定能找到这种环境下迁移数据的方法。
产品
EMC Corp 的Rainfinity 和F5 Network Inc 的Acopia 功能都非常强大,在市场上有绝对的竞争力。它们都可以提供用户需要的任何功能,例如全局命名空间、文件级别分层和目录级别分层,而且它们还提供带内和带外 两种方式供用户选择。
中小企业市场也引起了一些公司的关注。AutoVirt公司已经开始向中小企业提供
数据迁移方案。澳大利亚的SmApper公司也开始涉足该领域。
文件虚拟化不仅仅具有迁移分层功能,还可以告诉用户每种数据需要制定何种策略,并且还具备降低程序负载的功能。所有上面的功能都是文件区域网络所必需的,这也正是文件虚拟化那么流行的原因。
评价
和块级虚拟化简化了SAN管理一样,文件虚拟化消除了企业级NAS系统的复杂性和局限性。 我们都承认
非结构化数据急剧增长,并且IT很难控制那些数据,文件虚拟化这时帮了一个大忙。
文件虚拟化使物理文件服务器的基本细节和NAS设备抽象化,并跨那些物理设备创建了一个统一命名空间。命名空间指的是目录和文件及其相应的数据结构。通常一个标准文件系统,如
NTFS文件系统,一个空间与一台计算机或文件系统相关联。通过把多文件系统和设备都统一到一个单独的命名空间下,文件虚拟化提供了一个单一的文件和目录,并为
管理员提供了一个更易于管理数据的单控制点。
和
存储虚拟化带来的好处一样,文件虚拟化也可以在无间断的情况下,把文件
数据迁移到另一台。
存储管理员可以在不影响用户和应用的前提下,进行NAS设备的日常维护以及旧设备的废弃。
当文件虚拟化和
集群技术相结合时,它的可扩展性和性能都显着提高。一个NAS
集群可以提供数量级吞吐量(Mbps)命令和IOPS.
高性能计算(高性能计算)应用,如地震处理,视频渲染,科研仿真,很大程度上依赖于文件
虚拟化技术为用户提供可扩展的数据访问。
三种架构方法,只有文件虚拟化还处于起步阶段。不同厂商的方法适用于不同的使用模式,没有放之四海而皆准的。一般来说,你会发现现在市场上三种不同的文件虚拟化方法:集成平台的命名空间,
集群存储派生的命名空间和网络虚拟的命名空间。
集成平台的命名空间是主机文件系统的扩展。它们提供了一个特定的平台。这一类型的命名空间非常适合多站点协作,但他们往往缺乏文件控制,因此他们就限制在单一文件系统或操作系统内。 如博科StorageX,NFS v4和Microsoft
分布式文件系统(DFS)。
集群存储系统结合集群和先进的文件系统技术,创建了一个可支持无限增多的NFS 和CIFS请求的模块化可扩展系统。 这些
集群系统是一个统一的,跨所有集群因素共享的命名空间。集群存储系统非常适合高性能应用,把多文件服务器整合到一个单一的高可用性系统内。这些厂商主要包括Exanet,
Isilon公司,NatApp公司(Data ONTAP GX),惠普(PolyServe)公司。
网络虚拟命名空间是由网络设备(通常称为网络文件管理器)创建的。网络文件管理器存在于
客户端和NAS设备之间。 基本上充当
路由器或交换机,这些设备在用户和存储之间展现一个虚拟的命名空间。 网络虚拟命名空间非常适合用于
分层存储部署和其他的非中断
数据迁移情况。