Netbackup磁带故障现象描述:nbu的活动监视器中出现了很多红色,一看都是备份不成功的,大部分是96错误;unable to allocate new media for backup, storage unit has none available(96)。
看了一下存储单元好像没有啥问题,再到报表中看了一下磁带,发现磁带全满,原来磁带的设置retention全部是infinity(无限),怪不得呢。 已经没有剩余的空带子了,找到最后写入时间比较晚的磁带,原本想quick earse快速擦处,提示不可以,long erase、label都不可以,因为里面的img数据还没有过期,看来需要先把磁带直接过期才行。
在tape list报表中找了一盘最后写入日期比较早的磁带。进入C:Program FilesVERITASNetBackupbinadmincmd,运行:bpexpdate -m 磁带编码 -t 0
磁带过期了,进入tape list报表,查看磁带使用情况,居然没有变化,还是full,刷新还是full!
再次运行bpexpdate,提示却已经过期了。
进入 C:Program FilesVERITASNetBackupbingoodies运行available_media,显示的磁带却是available_media。nbu这个控制台看来是做的是真的很糟糕啊!!!很多¥的
手工执行备份策略,还是显示96错误。从available_media中显示的看到了,有两盘带子被冻结了,估计是容量不够,奇怪的是他居然不使用我过期的空带子,而去调取热备池中的磁带,难道过期后他就不认了?
干脆删除磁带,然后robot inventory,重新加入磁带,再手备,还是提示96错误!
重新创建磁带池,重新创建备份策略,再手备份,还是提示96错误!
重新启动服务器,重新启动带库,再手备份,还是提示96错误。
见鬼了,好像和96错误一直纠缠上了。
细想一下,问题要么出现自己过期磁带有问题,要么是netbackup选取磁带有问题, 到网上查了一点选磁带的策略和bpexpdate相关知识:
一.netbackup备份挑选磁带的基本逻辑
1.备份作业在备份策略(Policy)中定义指定的卷池中(Volume Pool),挑选合适的磁带介质(Active或Available两种状态)。Active状态表示介质已经分配给某个Media Server使用;而Available状态则表示介质从未被使用或可以被重用(Reuse, 曾经被使用但其上面的所有的数据已经过期)。
2.当备份作业发起时,Media Server上的bptm (NetBackup Tape Device Manager)进程首先查看卷池中最近被使用的、状态为Active的介质中有没有和本次备份包(Image)的保存周期(Retention Level)相同的,注意拥有不同保存周期的备份包不允许写到同一个介质上;vmd (Volume Management Daemon) 进程负责将其装载(mount)到驱动器。NetBackup随后定位到上一次备份的结尾,开始写入新的备份。备份包的保存周期是由我们Policy中的Schedule来定义
3.如果没有合适的Active介质,NetBackup将从Available介质中挑选一盘,其中从未使用过的新介质优先于可重用的介质。
4.如果指定的卷池中没有符合条件的介质,NetBackup将从Scratch卷池中申请一盘,如果失败,备份任务将报96号错误并退出。
二.磁盘的过期和删除
long erase:是把磁带从头到尾写一遍。能彻底的清除磁带上的数据。
quick erase:只是在磁带上打一个数据结束(EOD)的标记。读带的时候,一看到EOD标记,就会认为已经到数据结尾了。如果用mt等命令,是能把磁带上的数据恢复出来的。
bpexpdate过期磁带绝对不会把磁带里面的东西删除。除非你把过期的磁带用于其它备份。
又是一阵折腾,终于发现了一点蛛丝马迹,就是手工备份的时候提示:required media is in use,看了一下驱动器,发现其中的一个驱动路径显示为”Down-TLD”状态。reset后显示正常,提示可以enable write。
声明: 此文观点不代表本站立场;转载须要保留原文链接;版权疑问请联系我们。