存储实战经验:一个灾备项目的总结

日期: 2012-05-17 作者:star_storage 来源:TechTarget中国 英文

总结下最近做的一个灾备项目,期间遇到很多问题,不过最后还是成功解决了。

1、光纤模块

将A地的数据灾备到B地,中间相隔40公里左右,两端各有一个光纤交换机,A地是HP 的,B地是Brocade的。不过HP的那个是OEM Brocade的。从一个厂商那买了几个单模的光模块,各插在两端的交换机上。结果发现不能通讯。一开始怀疑是链路衰减,后来经过测试发现不是,再怀疑是模块的问题,可是模块厂家过来换了2次,还是不通,结果模块厂商坚持认为是链路衰减的问题。后来就拖啊拖了1个多月(期间正好过年)。最后同事从北京公司换了个模块,问题成功解决。看来问题还是出在模块身上。

2、RAID降级

B地的管理服务器(安装SANtricity软件)启动时报错,出现degraded字样,进RAID卡调试发现做的RAID1,强行进入系统,没有问题。

3、HBA卡

在管理服务器上用SANtricity软件指定一个卷,并将这个卷映射给主机后,发现主机不能识别,后来将光纤插到另一个HBA卡上即可,原先那个HBA卡是坏的。

4、双控、多路径

由于存储是双控制器,并且两控制器都启用,因此主机连接存储的一个卷时默认会发现两个硬盘,在主机层配置多路径即可。如果存储厂商不提供多路径软件,主机使用开源或免费的即可。

5、HBA卡驱动

主机通过光纤连接存储,走FC协议,因此需配置HBA卡,并且在主机上安装HBA卡的驱动

6、集群文件系统

A地主机实现Oracle双机,使用同一个存储卷,走FC协议,结果主机方面的集成商说以前从未遇到过,只会做NAS方式的。我推荐他们用OCFS实现卷共享,他们说不安全。。。。我无语了,继续推荐他们用其他集群文件系统。后来涉及到费用问题,他们还是乖乖的用OCFS了。

7、NAS机头

还是上面那个问题,客户的技术人员说既然无法实现卷共享,那就在存储前面加一个NAS机头。但是NAS机头价格比集群文件系统软件贵,而且用于数据库环境性能会变差。

8、镜像卷及切换

A地的A卷和B地的B卷做镜像关系,当A卷发生改变时,能立即反应到B卷。这样万一A卷故障,即可先停止他们的镜像关系,然后将B卷挂载即可。

9、Solaris

B地的主机是Solaris,集成商不太懂,现场用手机各种查啊,比如查看HBA卡的WWN号,对磁盘格式化分区,多路径配置等等。

10、项目验收

客户提出需要找第三方公司做A地同步到B地的性能测试,Oh my God。。。

总结:

(1)、项目中遇到多次是硬件设备的故障,例如光纤和HBA卡,当出现问题时,千万不能一根筋,要从各个方面去排查,大胆尝试,小心求证。

(2)、事先要准备好相关的实施资料,包括设备驱动、用到的软件、相关系统和设备的使用手册,不怕一万就怕万一。

(3)、做售前或售后,不要求你像研发那样精通到底层协议,但是要涉及的知识面要广,从主机到应用再到存储都要懂。

(4)、该你做的你就做,不该你做的你可以帮助,提供建议或文档,但是不要自己去动手做,不然出了问题就头大了。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

相关推荐

  • 揭开灾备真相——那些年我们见过的灾备术语

    作为数据保护的最后一道屏障,灾备系统的重要性不言而喻。IT圈好像一夜之间都在说灾备,那么到底什么是灾备?为什么灾备如此重要?未来发展趋势如何?本系列文章带你认清灾备真相。

  • 年营收平均环比增长200%+ 英方是如何做到的?

    英方自2014年全面开拓灾备市场以来,至2017年每年的营业收入平均环比持续增长超过200%。那么,是什么造就了如此高的业务发展速度?

  • 存储极客:大话“双十一”与经济适用型双活

    有了存储复制/双活之后,在一些关键应用中,同时进行数据库层面的逻辑或者物理复制保护也是有必要的。此外,为了保证跨数据中心双活存储的自动切换和避免脑裂,像第三站点仲裁这样的技术EMC、戴尔等厂商也是支持的。

  • Fujitsu基于Ceph推出Eternus CD10000

    Fujitsu最新推出基于Ceph的Eternus CD10000,该产品加入了优化的纠删码、容量侧重和性能侧重的存储节点、内部备份以及为灾备设计的分离式集群等特色。