深入浅出大数据存储

日期: 2013-10-07 翻译:statfs 来源:TechTarget中国 英文

在该视频中,来自Neuralytix公司的主管编辑Ben Woo与来自TechTarget存储媒体集团总编Rich Castagna一道,就Hadoop和大数据项目中的存储进行了讨论。

大数据这一词汇总是被各个厂商和追随者提及,在健康护理和媒体/娱乐领域尤甚,但从定义的角度进行区分并不容易。

依Woo所言,处理大量的非结构化数据并不在于存储卷大小,而在于将数据置于可以创造价值的上下文中。大数据项目通常涉及一些外部因素,如Hadoop或其他数据处理技术。

大数据的海量和非结构化特性意味着系统可能无法处理频繁的I/O请求或无法保证数据及时交付的有效带宽。并可能引发存储的膨胀和管理上的难题。

Woo说,应用于大数据项目的最为流行的存储方案,即为线性扩展的对象存储,这是因为其高粒度处理元数据的能力。“不像传统NAS(网络附加存储)或SAN,它是分布式的——它还是基于对象的”,他提及大数据的环境时说道。“它需要可以线性扩展的容量,之前这似乎从未达到。”

在大数据领域炙手可热的便是Hadoop,虽然它并非处理大数据的唯一途径。但是,受益于Hadoop分布式文件系统(HDFS,更为统一的数据管理)致使一些厂商调整其产品以期与之更好的协作。“我们可以预见在未来的10到20年的时间里,HDFS或其变体,将会成为服务于各种类型应用和存储的唯一的文件系统”,Woo说。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

相关推荐