又一次站在年末,回顾2012年,“云存储”和“大数据”或许是存储领域最为热门的词汇,不论传统的存储供应商,还是新兴的方案提供商都将自己的产品贴上类似的标签。对于“云存储”,不少人尚能将其和虚拟化技术、异构存储整合、统一存储等技术关联起来。而谈及“大数据”时,即便是资深的IT分析师们也无法统一其定义和实际应用领域。本篇就什么是大数据,以及大数据可能的应用场景进行解析,以期能够勾勒一个和日常IT应用紧密相关的“大数据”。
前几期的“存储经理人期刊”上谈到过大数据定义的模糊之处,究竟是海量的小文件能够称为大数据,还是为数不多的大文件才能称为大数据?在这里笔者浅见认为,单个文件的大小,甚至是企业整体的……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
又一次站在年末,回顾2012年,“云存储”和“大数据”或许是存储领域最为热门的词汇,不论传统的存储供应商,还是新兴的方案提供商都将自己的产品贴上类似的标签。对于“云存储”,不少人尚能将其和虚拟化技术、异构存储整合、统一存储等技术关联起来。而谈及“大数据”时,即便是资深的IT分析师们也无法统一其定义和实际应用领域。本篇就什么是大数据,以及大数据可能的应用场景进行解析,以期能够勾勒一个和日常IT应用紧密相关的“大数据”。
前几期的“存储经理人期刊”上谈到过大数据定义的模糊之处,究竟是海量的小文件能够称为大数据,还是为数不多的大文件才能称为大数据?在这里笔者浅见认为,单个文件的大小,甚至是企业整体的数据量都不是企业考虑是否要应用大数据的决定性因素。
企业在日常活动中产生了大量的文件信息,而这其中的很大一部分都以不同的形式存储在不同的媒介上,大数据就是希望通过发掘、分析这些日常数据,从中预测企业业务发展趋势,增加商务决策的准确性。大数据有三个主要特征:大量的数据、不同形式的数据,以及快速获取最新的数据。
大量的数据:大量TB甚至PB级别的数据或许是对大数据最普遍的认识。由于过去的关系型数据库无法处理诸如Web访问日志,工作日志等大尺寸数据,即便可以,数以百万计的数据项目也要花费很长的处理时间。而通过大数据,这些数据项目可以更快速的得以处理。
不同形式的数据:诸多不同格式的非结构化数据,例如文本文档和照片,这类信息在推特等社交网站上大量交互。过去的商务活动很少参与到这其中。而现在,这类信息可以和传统的数据一起进行处理。
快速获取最新的数据:传感器、IC标签等智能设备每秒钟都会产生大量数据,通过大数据可以对这些数据进行实施分析并作出响应。
大数据生产于社区或商务活动,社区上的各类信息和传感器数据在传统的信息系统上很少会被关注。使用大数据的本质在于收集分析业务活动中的各类数据,包括以往被关系型数据库所忽略的大部分数据,从而发现新的趋势或模式来进行商务决策或创造新的业务机会。大数据使得收集各类大尺寸的数据、准确地分析、快速决策和实时行动成为可能。
那么今天你的业务是否有必要采用大数据应用呢?我们先看下全球的大数据应用一般有这样三类:
应用场景类型一:改善关键业务系统的处理效能,实现高速的批处理流程。
以商品销售为例,通过批处理分析所有商铺销售数据的亿万条记录,每个商铺可以精准地选择其热卖商品,从而提升商品销量。以往的IT系统很难对销售数据做出实时分析,而大数据的并行分布式处理能力能够极大地扩展分析范围。这样在进行决策时,就可以根据实时得到的数据而非直觉来找出热卖商品,在提升销量的同时减少了浪费;同时,大数据还能够分析出消费行为,提升优质客户数量。
关键业务系统中的大数据应用还可以快速地提供电子账单。以往的单据处理通常需要大量的时间,大数据可以节省大量时间,使得记账数据的统计更加快速,账单出具更为频繁,这样就可以获取到最新的用户账务信息,使得资源分配更加优化,或者提升库存生产的准确性。
此外,大数据还使得关键业务系统中的在线业务和批处理过程同时发生,这样业务就能够实现24小时不间断运作,无需计划内宕机时间。
应用场景类型二:利用信息系统中的结构化数据和非结构化数据。
从各类社交网站上,企业或许能够收集到各种用户抱怨或竞争友商的信息,如果能够实时获取这些信息并作出快速响应,可以在用户正式投诉之前提供反馈、解决问题,大幅度地提升最终用户的满意度。
同时,电子商务的兴起使得这类企业产生了许多新的客户信息,例如购买历史记录,商品评论,商品网页的访问次数和驻留时间等,通过快速分析这些信息可以找出信息背后的热销商品和常客户,从而找到新的销售机会。
对于传统的商铺,通过结合商铺视频记录中客户流量,性别,年龄、出入时间、天气因素,以及POS机的销售数据,可以分析出商铺摆放位置等重要结论,从而便捷地提升销量。
在医学应用领域,通过结合病患以往的生活方式和电子病历记录可以预测出该患者的疾病信息。基于疾病和卡里路摄入量,每天步伐数量和身体体重的关联,大数据可以帮助人们调整生活方式从而降低疾病的风险。
应用场景类型三:实时数据分析带来的新商机。
新兴的电子优惠券服务公司可以通过对比客户的位置信息、会员记录和周边的商铺信息,实时分析并送出最适合该会员消费的商铺优惠券。
而通过收集分析复杂的路况信息,包括车辆位置,时间,车速,道路服务公司可以为其客户提供精准的路面状况,避免可能出现的道路拥堵。
电子公司则可以通过监控智能电表上的发电情况、电能消费以及传输信息,准确地作出电力供应预测,降低发电成本,减少浪费。
以上这些所列是全球已有的各类大数据的实际应用。而随着技术的普及,大数据供应商将通过挖掘那些以往被我们所忽略的信息,为最终用户带来更多领域的应用。
相关推荐
-
存储基础知识:三大公共云中的对象存储
大部分公共云存储是基于对象存储。块和文件在数据中心占主导地位,但在云端,对象存储才是王道,因为云端需要大量相对 […]
-
Microsoft Azure存储团队想要更简单的闪存设备
通过参与开放计算项目(Open Compute Project),这个云计算巨头正在联手其他供应商打造“定制S […]
-
NetApp Cloud Volumes完善OnTap文件存储
NetApp为企业提供了新方法来扩展OnTap文件存储到云端。 在上周NetApp Insight大会,该供应 […]
-
Micron开始向部分客户发售更密集的QLC SSD
Micron Technology公司开始向部分客户发售采用新型高密度QLC 3D NAND闪存技术的企业固态 […]