Wikibon研究报告:使用同一数据源消除应用程序的数据副本

日期: 2015-03-18 作者:David Floyer 来源:TechTarget中国

使用同一数据源消除应用程序的数据副本

在基于磁盘的环境中,多个数据副本总是存在的。避免多个应用程序同时访问同一驱动器上的相同数据,以及数据库环境下避免多个应用程序同时访问同一张数据库表,这些都深深植根于磁盘存储的实践准则之中。例如,为支持开发团队成员的工作,需要将目前的生产环境克隆一个;数据被复制并装载到数据仓库中;以及数据的多个版本都存在于Hadoop大数据系统中。 Wikibon估计,数据通常被复制8-10次。数据副本通常是一个子集——例如,开发者可能需要生产数据库的一小部分。究其原因主要是考虑到生成这些副本所需的时间,以及所需物理空间。

快照是磁盘存储阵列的一项重要技术。节省空间的快照(Space-efficient snapshots)只捕捉上次快照以后有变化的块,这种方式与传统的差分备份相似,并允许快速回滚到先前的数据版本。还有一种非常有用的快照类型就是对同一数据记录它的逻辑拷贝;然而,传统磁盘存储系统的性能特性和元数据管理很大程度上使这些副本对于活跃的磁盘共享工作流程毫无作用。在需要多个数据拷贝的情况下,总是使用完全克隆。例如应用程序开发者,通常仅需要整个数据的一个子集。

闪存没有磁盘驱动器IO访问密度的约束。利用节省空间的快照以及高性能的元数据,一个数据的逻辑拷贝可以在几秒钟内建立起来并提供给应用程序,但共享的是同一份没有改变的物理数据。例如,开发团队在欧洲投资管理公司获得生产数据库的一个副本,然后将最新的全套应用程序和数据发布给所有开发人员、测试人员和QA。开发人员已经从过去的IO受限过渡到现在处理器受限的开发环境——他们需要更快的处理器以提高开发效率。他们从过去的一个子集发展到拥有一个完整的生产副本,因此测试和QA有效得多。在这种新环境下,重复数据删除的去重率提高了10倍。闪存意味着开销接近于零,产生一个新的开发副本的时间也缩小了10倍以上。一些客户案例引用参见下面“案例研究:电子数据中心实施”一节。

另一个潜在例子是开发分析大量实时数据,再对业务系统实时调整的应用程序。当操作和分析的应用程序共享数据时,这种系统往往更容易实现。

迁移到这种环境的最大制约将是如何说服高级存储管理员和数据库管理员采用新的方式管理生产系统(存储),因为他们已经与现有阵列的各种限制磨合顺畅。对于生产新型闪存阵列的存储厂商来说,最大的限制是说服他们存储阵列的架构和元数据管理在这个新的环境里将会完全不同。

关键点:管理层需要积极推动IT管理人员和IT供应商(软件和硬件)对于全面部署电子数据中心的态度转变。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

相关推荐