|
NEC数据备份系统方案白皮书
1
概述
随着计算机技术的快速发展以及应用的广泛深入,计算机技术被广泛地使用在企事业单位的各个业务环节,越来越多的依赖于计算机技术的应用系统成为我们日常工作的得力伙伴。在给我们带来方便和效率的同时,也使得各行各业对于计算机技术的依赖程度越来越高。
信息系统由于其自身结构的复杂性,在运行过程中常会出现各种各样的故障,这些故障都会不同程度地造成数据的丢失或者不完整。这四类故障包括以下几种情况:
²
系统硬件故障:系统硬件故障会导致数据错误,当与存储或数据传输有关的硬件出现故障时,甚至会导致数据丢失或者损坏;
²
系统软件故障:软件故障通常由不稳定的系统补丁或有缺陷的应用程序
引起,除会导致数据错误外,还可能引起系统无法启动,丢失数据;
²
人为操作错误:人为操作错误可能是误操作,导致数据丢失或者损坏;
²
自然灾害:火灾、地震等自然灾害引起的信息系统破坏也是数据失效的客观原因。
所以,除了追求各个设备和系统的可靠运行外,还应该防患于未然,定期将系统的关键数据进行备份,以备不时之用。
2
数据备份技术介绍
数据备份,就是将数据以某种格式和方式加以保留,以便在系统遭受破坏或其他特定情况下,可以将数据恢复到以前某个时间点的状态。数据备份包含备份和恢复两个操作过程,实际执行过程中一般采用自动备份和手工恢复。数据备份具有以下特点:
u
时间性:备份是按照一定策略在某个时间点进行数据备份,而用户可以选择不同的时间点进行恢复。
u
可逆性:备份和恢复的过程在某个时间点上是一个可逆的过程,数据在检入之前和检出之后的形态应该完全一致。
为了达到备份和恢复的最优化,数据备份行业在不同的层面上进行技术延伸,而这些新技术都在解决以下问题:
I.
最优效率;
II.
可管理性;
III.
降低对主系统的影响;
IV.
降低成本。
2.2
不同层面的备份技术介绍
2.2.1
网络技术
2.2.1.1
基于LAN的备份
通常地,在公用以太网网络上同时运行“备份控制命令”和“备份数据流”的备份系统称作“基于LAN的备份”。备份介质可以通过SCSI连线与备份服务器部署在一起,也可以以NAS的方式部署在以太网上。
基于LAN的备份系统在每个需要备份的应用服务器系统上的都需要部署一个Agent,不同的应用有不同的Agent。
基于LAN的备份最大的优点是部署简单,无需改造原有的体系结构;其最大的缺点,其在备份时,不仅占用应用存储资源,而且占用要备份的服务器资源,比如要备份Oracle数据库系统,其不仅占用存储的I/O资源,而且还要占用Oracle数据库服务器CPU、内存、I/O资源,这样会降低整个系统的效率。
所以,基于LAN的备份,一般都部署在中低端应用,其备份时都建议在非生产时间进行,以免影响业务系统。
2.2.1.2
基于SAN的备份
SAN备份架构中两个重要的应用是“LAN-Free
Backup”和“Server-Free
Backup”。
“LAN-Free
Backup”可以使部分“备份控制命令”和全部“备份数据流”在存储网络中运行,大大减少对公用以太网的负载压力。
在LAN-Free
Backup技术基础之上,还可进一步提高软件的功能和相应的硬件支持,使得备份操作能够通过磁盘系统,SAN交换设备和备份磁带库的协同来完成,而最大限度的减少服务器对备份作业的参与,这样使得服务器能够更有效地为各种前端应用提供服务。建立在这种思想上的备份方式是“Server-Free
Backup”。
实现“LAN-Free
Backup”和“Server-Free
Backup”是为了让以数据为中心的信息系统模式的核心提供更专注、更强健的功能,从而从体系架构上保证更好的系统效率,和更高的数据可用性。
2.2.2
备份策略
2.2.2.1
完全备份
完全备份(Full
Backup):就是对整个系统进行备份。当发生数据丢失的灾难时,数据恢复速度相当快,数据可靠性高;其不足之处一是备份数据量大,如果每次备份都进行完全备份,会占用大量备份存储空间,将显著增加用户的成本,其不足之处二是备份时间随着数据的增加而增加。
所以完全备份通常在初始备份和阶段性备份时使用。
2.2.2.2
增量备份
增量备份(Incremental
Backup):就是每次备份的数据只是相对于上一次备份后新增加的和修改过的数据。这种备份的优点很明显:没有重复的备份数据,即节省了磁带空间,又缩短了备份的时间。但它的缺点在于当发生灾难时,恢复数据比较麻烦,且可靠性也最差。在这种备份机制下,各盘磁带间的关系逻辑严谨,其中任何一盘磁带出了问题都会导致恢复失败。
2.2.2.3
差分备份
差分备份(Differential
Backup):就是每次备份的数据是相对于上一次全备份之后变化的数据。差分备份通常需要和阶段性的完全备份交替综合使用,这样不仅提高数据的可靠程度,又能节省备份时间和备份存储空间。
2.2.3
备份设备类型
2.2.3.1
带库
带库做为传统的备份设备,其最大的优点是每存储容量(GB)的价格相对其他存储介质非常低廉。
磁带设备是多种多样的,主要分为磁带机、自动加载机、磁带库。
磁带机(又称磁带驱动器,简称带机),是读写磁带的基本设备。它通过SCSI线缆与服务器直连,相当于服务器的外设,分为内置和外置2种。一台带机一次只能容纳一盘磁带,需要人工换带,自动化程度低。一般只用于单台服务器备份,适合于数据量非常小的企业。
如果企业希望通过预先制定的备份策略,实现备份过程和备份介质的自动化管理,减少系统管理的工作量,则需要购买能够容纳多盘磁带的设备,即自动加载机或带库。
自动加载机内一般能够容纳4~20盘磁带。它与带库的主要区别在于不是通过机械手抓取磁带,而是通过一个简单的自动传送装置移动磁带,并且只能配一台磁带驱动器。因此实现成本较低,但功能也受到限制。它虽然能够支持自动备份,但仍然属于低端的备份设备,适合于单台服务器或小型网络。
磁带库(常简称为带库)是专业的备份设备,它主要由库体、磁带驱动器、磁带槽位、磁带交换、控制面板、机械手和电子控制单元组成。库体内的大部分空间用于放置磁带,一台或多台驱动器安装在库体内专门的位置,用于读写磁带。带库工作时,机械手在管理软件和电子控制单元的控制下移动,通过安装在机械臂上的条码读取器寻找相应的磁带,然后将其抓取到驱动器内;读或写操作完成后,再由机械手将磁带取出,放回磁带槽位。由于带库内可安装多个驱动器,因此能够支持并发的多任务;对于一个大的备份任务,也可以分配到多个驱动器上并行读/写,从而大大提高备份效率,有效地缩小备份窗口。当然这些功能需要备份管理软件的支持。
一般具有几十个磁带槽位的带库属于入门级,几百个槽位的属于企业级,几千个槽位的则属于超大容量带库。企业级以上的带库还支持一些复杂的功能,如分区管理、磁带混装和级联扩展等。另外,随着SAN技术和LAN-free备份方式的推广,越来越多的企业将带库连接到SAN上作为共享的存储资源。因此带库厂商也非常重视带库对SAN的支持,很多企业级带库不仅提供光纤通道接口,还增加了SAN环境下的管理功能。
带库中使用的介质为磁带,使用磁带做为载体的技术分为螺旋扫描技术和线性技术。线性技术占据80%的市场份额,有取代螺旋扫描技术的趋势。线性技术中又有两种分支技术,DLT和LTO技术,DLT技术为昆腾公司所有,而LTO技术则为IBM、HP、希捷等厂商所共有,目前LTO技术的市场份额超过DLT技术市场份额。
2.2.3.2
磁盘阵列
由于ATA技术的发展,硬盘的成本在迅速的下降。现在,磁盘作为备份介质的优势已经越来越明显,因此采用磁盘阵列代替带库,成为备份方案中备份设备的一种新选择
事实上,磁盘作为备份介质的最大好处就是其介质管理工作的简化和性能的提升,并且介质的通用性优异。带库的管理工作非常的复杂繁琐,每个厂商都不同,会显著增加客户的管理成本;磁盘介质则几乎不存在这样的问题,这也是备份软件厂商看好磁盘备份的理由之一。
第3章
主要备份软件介绍
Backup Exec 为Veritas公司产品。
Veritas Backup Exec是业界公认标准的备份解决方案,并已获得Microsoft认证,适用于Windows
NT和Windows
2000及Windows
Server 2003环境,直观的用户界面,使用户能安心轻松地保护数据,它更结合了多种代理程序(agents)和功能选件(options),具有高伸缩性,能够满足各种网络环境和各层次用户的需要。
其主要特点有:
l
经过认证,支持Microsoft
Windows NT和Windows
2000 Server,Advanced
Server
和Datacenter,并支持Windows
Server 2003系列,确保兼容性和可靠性。
l
支持所有主流应用和数据库,如SQL
Server,Exchange,Oracle和Domino等,通过相应的代理程序可以对这些应用做到在线的数据库备份。
l
内置的"高级设备和介质管理"模块,完全自动地对备份介质进行管理,设置保存周期、策略等。
l
使用磁盘介质提供更快的备份和恢复,包括作为存储介质的硬盘,NAS设备和RAID系统;"备份到硬盘"技术可以大大降低小企业实施数据备份的总体成本。
l
支持专用备份网络进行备份和恢复,从而可以减少主网络上的LAN流量,加速系统备份和恢复。支持ServerFree功能:把备份卸载到SAN中的第三方数据移动设备,以增加服务器对应用处理的可用性。
l
智能镜像选项:包括加速许多小文件备份和恢复的远程功能。这是目前唯一提供的远程镜像备份。
l
自动警报通知和SNMP支持:通过BackupExec界面、SMTP电子邮件、寻呼、打印机、网络发送广播和网络监控应用来发出通知。
Backup NetBackup 为Veritas公司产品。
VERITAS NetBackup是专门为在异种平台系统上存储关键信息分布全球化的机构提高数据可靠性的强大的数据保护解决方案。这一数据中心增强解决方案系列几乎支持所有主流计算平台为所有领先数据库提供了备份和恢复的解决方案。管理员能够通过直观的用户图形界面来管理备份和恢复的所有方面,制定企业统一的备份策略。
其主要特点有:
l
几乎支持所有主流计算平台,包括各种UNIX、Windows
NT、Novell、Macintosh等。
l
几乎支持所有主流数据库,针对Oracle、SAP
R/3、Informix、Sybase、Microsoft
SQL Server和Microsoft
Exchange Server等数据库提供了备份和恢复的解决方案
l Java界面提供了对所有备份和恢复操作的完整的实时和历史情况分析,其先进的报表功能,帮助管理员快速分析备份和恢复工作状况,并进行监控和故障解决。
l
FlashBackup:RAW device备份功能结合在线文件系统快照备份,专为保护文件数量特别庞大的系统,同时提供以volume
level或个别file
level存储数据的弹性选择。
l
Multiplexed
Backup,可以自一至多台服务器上同时读取多份数据流,写至一个或多个磁带上,大大提高了备份效率和硬件设备处理能力。
l
Server Free
Backup:把备份卸载到SAN中的第三方数据移动设备,以增加服务器对应用处理的可用性。
l
Shared
Storage Option,SAN中的解决方案,能将单个磁带机虚拟化,在多台VERITAS
NetBackup服务器间进行动态共享,为用户节省硬件成本开销,还能大大缩短备份时间。
l
支持LAN FREE Backup。
l
Bare Metal
Restoe(智能灾难恢复)可以提供全自动系统恢复功能,大大缩短恢复时间。
NetVault是BakBone公司产品。
NetVault自动备份软件是真正可升级的、真正模块化的高性能备份与恢复存储管理软件,可在UNIX,
Linux, NT,Windows
2000和SCO等平台下使用。NetVault独特的架构可灵活地按您的信息存储需求的不断扩大和变化进行扩充和升级。
其主要特点有:
l
模块化的体系结构,容易安装的插入式模块,可方便的增减软件的功能和对众多商务软件的支持。
l
几乎支持所有的操作平台,包括Windows,Linux,Unix,Solaris等。
l
支持各种流行的数据库系统的备份,包括Oracle、SAP
R/3、Sybase、DB/2、SQL
Server、Lotus
Notes、Informix、Adabas、Exchange、NCR
Teradata等。
l
拥有广泛的对磁带库、磁带机的支持。
l
支持图形操作界面和命令行操作界面两种方式,并且支持远程操作。
l
对SAN 和NAS的支持。当硬件平台达到SAN的结构水准时,可方便平滑的升级到支持存储区域网络(SAN)环境下的备份和Server-less备份。
l
支持LAN FREE Backup。
l
采用硬盘虚拟带库技术可以大大降低成本,提高效率,适合中小企业备份环境的应用。
l
具有用于提高备份/恢复效率的多种手段,具有网络压缩、硬盘虚拟磁带库系统以及增强(TurboVault)共享内存和可调组块大小等先进功能。
4
数据备份系统典型方案
4.1
虚拟带库备份方案
虚拟带库技术就是采用备份软件对本地或者外部存储设备上的硬盘空间进行利用,虚拟一个磁带库来,外部存储设备采用连接的IDE硬盘接口的存储阵列,该方案适合中低端应用。目前,多数厂商的虚拟带库方案都是基于LAN技术备份的,从技术的发展趋势来看,这一技术将向基于SAN技术方向发展。
虚拟带库备份方案具有以下特点:
²
一次性投入价格相对便宜;
²
备份和恢复速度快;
²
系统部署简单;
²
维护简单;
²
设备通用性强

图1
基于LAN的虚拟带库备份方案
4.2
基于LAN的DAS备份方案
基于LAN的DAS备份方案为传统方案,适合从低端到高端的客户应用。备份设备可以选择磁带库、磁盘阵列或光盘库等,但以使用磁带库为主。
使用磁带库作为备份设备的方案具有以下特点:
²
通过扩充磁带的方式,无限量增加容量;
²
可以异地保存备份数据;
²
支持自动化加载磁带

图2
基于LAN的DAS备份方案
带库的选择上,建议选择基于LTO技术的带库,该技术协议为IBM、HP、希捷等公司共同开发,技术生命力强,降低用户潜在的维护风险。建议考虑ADIC公司系列产品,对于低端应用可以选择FastStor
自动加载机,对于中端应用可以选择Scalar
24/100带库产品,对于高端应用,可以考虑选择Scalar1000/10K等产品。
4.3
基于SAN的备份方案
基于SAN的备份方案是基于LAN的备份方案的升级,该方案的备份数据在高速存储网络流动,减少在以太网上的备份数据包,降低对业务系统的冲击,能够显著提升整个系统效率,其主要面对中高端应用市场。
基于SAN的备份方案中可以支持LAN
Free和Server
Free等备份方案,但需要相应的软硬件支持。如果采用LAN
Free备份方案,可以大大减少对公用以太网的负载压力,但需要购买备份软件中的相应功能;如果采用Server
Free备份方案,可以最大限度的减少应用服务器对备份作业的参与,这样使得应用服务器能够更有效地为各种前端应用提供服务,但同样需要购买额外的备份软件选项。

图4
基于SAN的备份方案
与基于LAN的备份方案不同,因采用光纤存储交换机。所以,所选择的带库应有支持SAN模块的接口。建议考虑ADIC公司系列产品,对于中端应用可以选择Scalar
24/100带库产品,对于高端应用,可以考虑选择Scalar1000/10K等产品。
附
名词解释
1、
数据备份:就是将数据以某种方式加以保留,以便在系统遭受破坏或其他特定情况下,重新加以利用的一个过程。
2、
DAS:直接连接存储(Direct
Attached Storage)。是指将外置存储设备通过连接电缆,直接连接到一台计算机上。
3、
NAS:网络附加存储(Network
Attached Storage)。其主要特征是把存储设备和网络接口,现在主要是以太网技术,集成在一起,直接通过以太网网络存取数据。也就是说,把存储功能从通用文件服务器中分离出来,使其更加专门化,从而获得更高的存取效率,更低的存储成本。
4、
SAN:存储局域网(Storage
Area Network)。SAN是独立于服务器网络系统之外几乎拥有无限存储的高速存储网络,它以光纤通道作为传输媒体,以光纤通道和SCSI的应用协议作为存储访问协议,将存储子系统网络化,在该网络中提供了多主机连接。
5、
LAN-Free
Backup:在SAN架构中,由于专用的存储网络的存在,使得可以借助软件和硬件的支持,让数据备份作业完全在存域网(SAN)范围内进行,而彻底不干扰公用网络(LAN)上的业务。这种备份方式被称为“LAN-Free
Backup”。
6、
Server-Free Backup:在LAN-Free
Backup技术基础之上,还可用进一步提高软件的功能和相应的硬件支持,使得备份操作可以主要通过磁盘系统,SAN交换设备和备份磁带库的协同来完成,而最大限度的减少服务器对备份作业的参与,这样使得服务器能够更有效地为各种前端应用提供服务。建立在这种思想上的备份方式是“Server-Free
Backup”。
7、
完全备份(Full
Backup):就是每天都用一盘磁带对整个系统进行备份,包括系统和数据。
8、
增量备份(Incremental
Backup):就是每次备份的数据只是相对于上一次备份后新增加的和修改过的数据。
9、
差分备份(Differential
Backup):就是每次备份的数据是相对于上一次全备份之后新增加的和修改过的数据。 |