避免数据迁移失败的五个最佳实践

日期: 2010-01-27 作者:Alan Radding翻译:郭镭 来源:TechTarget中国 英文

一直以来,无论企业使用什么样的存储介质保存他们的数据,数据迁移都是一个复杂的过程。欧洲独立IT研究机构Bloor的报告显示:尽管全球企业在数据迁移项目上的花费达到了约50亿美元,但是,仍有超过半数的数据迁移项目遇到过预算超支或者项目延期的情况。   我在这里说一个案例。一家位于波士顿(并且在全美其他地区有少量的分支机构)中等规模的非营利性组织,他们试图放弃以前使用的缺乏弹性的封闭式系统,并启用新的开源数据管理系统。

这个机构曾经主观的认为数据迁移不会很复杂,把它当做极其简单的事情看待。但是,在后来的操作过程中,他们犯下了好多错误。   项目开始不久,系统管理员就发现数据迁移绝不是像IT咨询专家所……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

一直以来,无论企业使用什么样的存储介质保存他们的数据,数据迁移都是一个复杂的过程。欧洲独立IT研究机构Bloor的报告显示:尽管全球企业在数据迁移项目上的花费达到了约50亿美元,但是,仍有超过半数的数据迁移项目遇到过预算超支或者项目延期的情况。

  我在这里说一个案例。一家位于波士顿(并且在全美其他地区有少量的分支机构)中等规模的非营利性组织,他们试图放弃以前使用的缺乏弹性的封闭式系统,并启用新的开源数据管理系统。这个机构曾经主观的认为数据迁移不会很复杂,把它当做极其简单的事情看待。但是,在后来的操作过程中,他们犯下了好多错误。

  项目开始不久,系统管理员就发现数据迁移绝不是像IT咨询专家所许诺的那样简单。计划漏洞百出,他们只能疲于应付。最初,他们没有为数据迁移规划出足够的时间,仓促地开始了移动数据的操作。他们也很粗心,在数据分类以及数据隔离问题上,出现了多次错误。虽然这很容易纠正,但每个错误都要浪费几天时间。

  除了准备不足之外,该机构还犯过其他更严重的错误。比方说,他们误以为在新系统上可以用不同于之前的访问方式使用迁移过去的数据,并且还对此深信不疑。他们还曾希望在迁移之前删除一些重复的数据,但时间已经来不及了,结果是一些不必要的重复数据也被迁移到了新系统上。

  所幸的是,该机构至少做对了几件事情。比如,当第一批数据迁移完成之后,他们立即做了测试,而后再进行下一批迁移操作。

  系统集成公司Advanced Systems Group 的首席技术官Mark Teter说:“大多数IT经理认为数据迁移工作属于日常杂事,很少予以关注。”,而重视程度不够恰恰是项目出现问题的主要原因之一。

  数据迁移的方法很多,用户可以简单的把文件从一个系统卷拷贝到另一个系统卷;或者使用诸如EMC SRDF(Symmetrix Remote Data Facility)、IBM Softek Transparent Data Migration Facility (TDMF)之类的数据复制软件;甚至直接用主机操作系统自带的卷管理器。还有很多种ETL(extract-transform-load,抽取-转换-加载)工具,也可以帮助我们简化数据迁移操作。

  数据迁移为什么会失败?

  Mark Teter为我们指出了导致数据迁移失败的几个主要原因:

  • 数据拷贝过程中出现错误。
  • 服务器宕机。
  • 目标存储设备崩溃或出现无法访问的情况。
  • 数据生产系统部分出现问题(如磁盘阵列发生故障)。
  • 数据生产系统整体出现问题(所有的设备都宕机)。
  • 迁移的数据本身就是损坏的,或者数据在迁移过程中出现损坏。

  Teter个人认为,在数据迁移过程中,保持数据完整性是一个组织需要承担的最大的风险。不能准确识别数据最新且有效的版本,是迁移项目中最糟糕的情况。他提示道:“实施部门必须关注整个迁移过程,必须做到每个环节都能够确保数据的完整性。否则的话,任何人都不能确信迁移过来的数据一定是最新的、准确的和完整的。”

  数据迁移的五步最佳实践

  如果要确保数据迁移不会出现问题,我们应该遵循以下五条最佳实践:

  1. 首先应该识别、挑选并且定位那些需要迁移的数据。
    我们应该完全清楚迁移中的数据到底是些什么数据,它们保存在哪里,当前的存在形态是什么,迁移到目标系统之后的形态是什么。
  2. 数据的抽取、清洗、转换、以及重复数据的删除。
    所有的原始数据都可能存在问题,数据迁移其实是一个契机,我们可以借此清理一下数据。
  3. 科学地实施数据迁移策略,系统化的转移数据。
    例如,规定数据迁移在夜间进行,此时网络的使用率比较低,对数据移动的性能影响较小。
  4. 测试和验证。

  测试迁移后的数据,以确保它的准确性,且满足格式的要求。没有经过测试和验证的数据,我们就不能视其具有完整性。

  5. 审计并记录迁移的过程。

  “法规遵从”要求我们必须记录数据迁移过程的每一个阶段,同时保留一份清晰的审计日志,其中的内容包括:操作人员、操作内容、操作的数据,以及操作的时间等信息。

  最后,回到刚才的案例,我们看看那个非营利组织是否遵循了Teter所总结的数据迁移最佳五步骤?第一步,他们知道数据在哪里,但是,他们没有仔细考虑当数据转移到新的目标点之后他们应该怎么做;第二步,他们没有完全做好数据清理工作,在迁移之后的测试过程中暴露出了问题。最初两个阶段的失误差点导致项目的失败,影响了他们的工作进度,增加了成本开销。幸运的是,一个稳固的测试流程帮助他们尽早发现了问题,避免了更致命的错误。

相关推荐

  • 迁移到云存储的五个最佳实践

    虽然说对真正意义上的云存储实现还有一段距离,我们现在已经在从管理员或者其他的专业人员那收集一些有价值的关于如何迁移到云存储的最佳实践。

  • 虚拟备份的最佳实践

    VMware的备份方式几乎每周都在变化。伴随着VMware不断推出新的产品和文档;更多的厂商争相证明他们的备份工具能与VMware一起工作;顾问们开始确定备份最佳实践。