数据科学中的大数据

日期: 2015-06-28 作者:Dave Raffo翻译:李冠楠 来源:TechTarget中国 英文

如果你仍对如何处理大数据以及如何更好的利用它心存疑惑,不用感到孤单,因为即便是从事国家安全和医疗健康数据分析工作的人们也还在寻找答案。

“我从来没明白过大数据这个词,”上周美国联邦政府的Tony Scott在大数据峰会上如是说,“是形容数据的胖瘦还是只是形容数据之多?不过它能很好的描述了在数据科学或数据分析领域的工作。”

大数据峰会小组成员之一的Hoot Thompson,举出一个大数据的完美例证。

Thompson表示,他的团队有30PB的磁盘存储和40PB的磁带存储与超级计算机相连。他还表示NCCS仅2014年一年的存储购买量就有20PB,虽然他指出这在历年的数据当中属于偏高的。

这家机构通过模型预测气候已经长达50年了。单独的一个模型就能创造3-4PB的数据量。

“我们并非数据的消费者,” Thompson说,“我们正在努力将数据展示出来以便其他机构作出决策。我们的所有数据都是共享的。”

Thompson谈到,他是一个开源爱好者。他在运行一个Gluster并已经持续两年了,他还计划实施一个基于OpenStack的存储云。

数据分析是大数据的关键,它并非只涉及气候变化的研究。大数据峰会的另外一个小组成员,健康科学家Suzanna Petanceska介绍了他团队的项目,通过研究来自上千人的脑数据做阿兹海默症的防治。那不仅需要将数据存储起来,还要找出这中间的重要信息。

Scott表示总共有三组人能够有效地进行筛选和分析数据。“你需要一些善于理出事情框架的人。”

“第二组人擅长于应用和数据操作。他们清晰的知道执行步骤。那么第三组人是由能够解释数据的人构成。这就是我所喜爱的不同个人技的团队多样性。”

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

作者

Dave Raffo
Dave Raffo

TechTarget存储网站高级新闻总监。

翻译

李冠楠
李冠楠

TechTarget中国存储组主编。

相关推荐