DataGravity CEO 谈数据感知存储

日期: 2016-01-03 作者:Garry Kranz翻译:Michael Zhang 来源:TechTarget中国 英文

从2014年8月开始,DataGravity就开始售卖他们的数据感知发现者系列2000统一混合存储阵列,提供了集成搜索、发现以及数据监管方面的功能。阵列利用了元数据分析来判断谁能对数据进行访问,哪些文件正在被修改,当这样的事件发生的时候,敏感数据存放在什么位置以及为什么存储容量超标使用了。 DataGravity CEO Paula Long在存储行业很有名望。著名的iSCSI先锋企业EqualLogic就是由她发起,后于2008年以14亿美金卖给了Dell公司。

DataGravity是她和前EqualLogic、Dell市场执行官John Joseph一起创立的,后者也担任了DataGrav……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

从2014年8月开始,DataGravity就开始售卖他们的数据感知发现者系列2000统一混合存储阵列,提供了集成搜索、发现以及数据监管方面的功能。阵列利用了元数据分析来判断谁能对数据进行访问,哪些文件正在被修改,当这样的事件发生的时候,敏感数据存放在什么位置以及为什么存储容量超标使用了。

DataGravity CEO Paula Long在存储行业很有名望。著名的iSCSI先锋企业EqualLogic就是由她发起,后于2008年以14亿美金卖给了Dell公司。DataGravity是她和前EqualLogic、Dell市场执行官John Joseph一起创立的,后者也担任了DataGravity主席的角色。DataGravity拥有130位员工,并且已经获得了9200万美金的风投基金。

Long这样描述DataGravity的目标,“全面了解数据的复杂性及对数据的洞察,使得这些信息从数据分类和数据保护的角度变得可消费化。”SearchStorage和Long一起回顾了DataGravity进入市场后第一年的表现,讨论了他们在数据感知存储上的发展历史以及未来方向。

DataGravity是您的第二家创业公司,我们知道,之前在您的带领下创立了出色的EqualLogic公司。从现在的角度看,企业级存储市场和2001年您创立EqualLogic时候最大的差别是什么?

Long: 当时我们创立EqualLogic的时候,存储还被看作是一个神话般的事情,只有一些技术极客才会对这方面事情感兴趣。当时的感觉就像是把一套装置安装完毕。所有的一切就像是你自己去完成,并且需要你对存储有着比较深入的了解。并且说实话,存储当时也不便宜。

在EqualLogic的时候,我们的口号是“客户购买了存储,因此客户需要自己去使用和管理它,作为厂商的我们在提供标准支持的同时也提供了一些新特性。”那时人们认为这样的想法有些奇怪,但如今当我们去看存储初创企业的和他们的产品,大多数的厂商都能够提供自管理和全功能存储。EqualLogic是首批100%通过全渠道销售的方式完成的厂商,而当今大多数初创公司也是这样的模式。我们非常高兴EqualLogic给如今这些初创厂商做了很好的示范。

DataGravity是如何从一个萌芽的想法逐渐发展成一个市场化的产品平台的?

Long: 在EqualLogic之后,我们在考虑下一步该做点什么的时候,我们意识到人们逐渐开始讨论大数据以及数据安全相关产品,但并未和主存储相关话题结合讨论。DataGravity正尝试着做的就是让存储变得易于管理。存储需要承担起相应的责任,除了保证数据安全,同样也需要让数据变得智能起来,这样才能体现数据真正的价值。

我们简单的做法是重新架构存储存放数据的方式。我们使用了工业标准的存储阵列。相比于传统阵列产品来说,我们在硬件上配备有更多的内存以及计算资源,我们使用了单独的控制器以完成分析工作。我们的阵列产品实时收集信息。我们的软件完成翻译的同时,能做到实时提供写操作的指令信息。

我们认为客户会逐渐的受到这项技术的吸引,这样他们可以更好的了解数据的真实内容,同时机器能够帮助他们完成最优数据存放的决策。在数据存放之前,你需要了解到数据的相关信息。盲目的将数据送到云端而不去切实了解数据本身,就好比将一个习惯不好的孩子直接送进了寄宿制学校,并期望他们能养成好习惯那样。

数据感知正逐渐变得热门。DataGravity是如何定义数据感知存储的?

Long: 在了解数据内容以及其访问权限之前,其实用户无需优化其数据管理流程。这就好像在阅读相关资料前就要完成条款准备那样。我们是以存储的角度来理解数据的安全。用户甚至不应该雇佣专家来了解数据的真实内容,或者是为了了解其真相损失了存储性能。

人们不需要额外的存储公司帮助他们的更高效的利用闪存,或者那些使用了所谓更好的重复数据删除技术的存储公司。他们唯一需要的是对数据的可视性方面的增强。我们将给用户一套360度可视性的方案,使用户了解到这些数据和哪些人有关系,以及它们的内容和相应的操作信息及时间。用户将逐渐的了解到有关这些数据的统计信息并且可以开始考虑更为智能的管理这些数据。

我们解决方案架构师的一句名言是,“最好的去重就是删除。”关键的问题是,作为用户,他们并不知道需要删除哪些数据,因为他们对数据并没有可视性方面的了解。我们能够帮助用户进行数据分类,以便实现更为智能的、防错的删除不需要的数据。

DataGravity的主要应用场景有哪些?

Long: 我们需要了解数据存放路径并且同时了解存储的存放方式。

我们可以根据用户的选择,支持通过三种途径适配到环境里。如果客户有一个安全类的项目,我们可以将其带入为一个资源池的方式,来监管和检查数据。

其次,如果一个客户需要更多的高端存储,那么他可以考虑将非结构化数据存放到DataGravity里,使得用户对这些数据做到一目了然。其实对于现有的其它存储来说,我们是一个有力的补充。我们已经在一些客户那实现了Nutanix和DataGravity之间的配合使用,还有一些客户实现了与EMC以及其他存储的配合。

第三个融入方式是,当用户考虑使用存储更新的时候,我们可以更换现有的存储。我们不期待全部更换。我们的关注点更多的是在那些需要识别的非结构化的数据上,因为这个领域是迅速增长也最容易出现问题的领域。这块领域也是最难控制的。

哪类公司会考虑使用DataGravity存储?

Long: 我们渠道的关注点是在中等规模的企业用户上,但在一些小企业和大规模企业上也有其重点。我们最近在研究我们合适在哪些场景和平台上使用,我们惊喜的发现我们的适用场景竟是如此的广泛。我们有来自教育行业、律师事务所、州政府以及本地政府、小型金融机构上以及任何有管控需求和丰富内容需求的场景。

DataGravity目前有多少付费用户?

Long: 我们通常不会谈论用户数量或者用户的购买量。因为讨论增长本身并不明智。这是关于数字的规则。我们所能评估自身的一个方式就是我们能拿出多少实际的数字出来说话。这绝对是一个非常有意思的产品,因为我们实实在在的帮助客户解决了一个又一个的不同问题,这些问题的解决帮助用户节约了花费并且解决了他们在信誉方面可能带来的影响。

能不能和我们说说用户使用DataGravity产品的例子?
 
Long: 我们有一个律师行的客户,他们正好有一个助理准备离职。在她离职之前,她认为她留下的内容归属于她本人。这位律师于是就开始拷贝所有她经手过的案子,其实就是做一份数据导出。在仅仅五次点击后,我们的阵列就可以告知用户这些操作是什么时候发生的以及哪些数据涵盖风险。

存储应该有自我免疫功能;在出问题的时候应该有通知。DataGravity能够识别出来非正常的写操作,就像备份一份数据那样。DataGravity了解文件的操作者、内容和时间之间的内在关系,我们可以判断出哪个具体的问题被写入了、什么时候非加密内容变成了加密的内容、谁造成了异常写操作密集,并且回滚了这些文件。我们的努力使得通常会花费一周或者两周的操作,缩短到了短短的一小时甚至更少的时间。

基于行为的备份和传统备份的差异在哪里?

Long: 传统的备份通常有恢复点目标和恢复时间目标两个概念,因为备份的实际就是拷贝数据。DataGravity实现备份并不用拷贝任何数据。我们的备份即时发生并且是为了防错,我们将备份分散放置在不同的磁盘轴上。我们将阵列里所有的快照都保留下来,以支持文件级、对象级甚至是镜像级的数据恢复需求。

DataGravity存储是如何做到细颗粒度数据识别的?

Long: 存储阵列通常对数据本身都比较了解,但从用户角度看他们却很难获得这些信息。这其实是行业里一个奇怪的禁忌,即存储不应该了解数据,这的确真的很奇怪。这就好比让一个人在屋顶拿着望眼镜去看房间里有什么,而为什么不能直接走进去看看?

每当有人访问数据的时候,DataGravity将会识别该用户是否有权限对数据进行读写操作。我们会将数据以及与其关联的元数据,插入到数据路径里。我们将精良优化过的对存储的写操作做镜像,并且将元数据一起存放到一个不曾使用过的空间里,并对所有的内容进行包含400到600种不同文件类型的索引。这就是用户想知道谁在什么时候访问了哪些数据以及为什么访问这些数据的原因。

2016年DataGravity的产品规划是怎样的?

Long: 我们很擅长定义,识别以及防御。我们对元数据的梳理意味着我们在操作安全防御,预测以及抢先方面能够做的事情还有很多。在我们进行规则定义的时候,需要确保不要误判。也许作为用户来说的确不会在凌晨三点访问财务数据,但这也不意味着你在那个时候会有相应权限。这可能仅仅意味着我们需要对用户行为有更多的了解和审查。

相关推荐