认识和了解EMC数据湖(Data Lake 2.0)

发布时间:2017-04-11 09:17:48

 在上一篇文章中已经详细介绍了什么是数据湖,已经EMC的数据湖1.0产品,本节主要介绍一下EMC近发布的数据湖产品2.0。“数据湖“可以存储所有需要使用的数据,这些数据包括传统的数据库结构化数据,以及文本之类的非结构化数据。同时,”数据湖“还是一个共享的大数据分析平台,在”数据湖“中可以通过分析数据找到数据之间的关联性。

EMC做为存储业界的技术先驱和优秀者,为了进一步扩展”数据湖“概念的内涵,为迎接数据湖2.0时代,EMC发布了下面的三款产品:

l  Isilon SD Edge,扩大数据湖边际;

l  8Isilon操作系统

l  Isilon CloudPools,通过拥抱混合云,实现降低使用成本

 EMC IsilonSD Edge

 根据ESG的研究报告,现今53%的大型企业拥有100个以上的远程分支机构,在2011年这个比例为30%。而连接数据中心的远程分支部门往往面临着磁盘可用空间少、管理复杂、分支技术人员水平参差不齐以及使用不同的文件系统格式等问题,IsilonSD Edge可以解决所有这些问题。

 IsilonSD Edge是一款100%软件定义的,支持X86平台的数据管理软件。它可以运行在VMware上,并且与VMware vCenter完全集成,管理简便。此外,IsilonSD Edge不同于Isilon模拟器,它多可以支持安装6个节点,大支持36TB的容量。安装了IsilonSD Edge软件的主机具有OneFS操作系统的全部功能,可以使用OneFS操作系统支持的数据服务和网络协议,核心和边缘之间可以使用复制功能来拷贝数据。通过该软件可以极大的缩短远程分支部门访问文件系统的速度,提高数据服务的连续性和经济性。

8Isilon操作系统

 除了EMC IsilonSD Edge功能,明年初EMC还会推出Isilon8代操作系统,在新版本中将会有以下几点改进: 

l  全新OneFS内核可以提供更强劲的性能和更全面的功能,进一步提高数据湖的能力。

l  新版本将支持SMB 3.0协议,实现客户端非破坏性重新连接。

l  改进Insight IQ和文件分析数据能力,简化管理。

l  支持完整的无中断升级功能,以及操作系统版本回滚功能。

 

 新版本中的增强功能可以简化Isilon的管理,提高效率,增加灵活性,并为数据湖2.0提供更强的运算能力。

 

 

 

EMC CloudPool

 近年来随着用户信息量的快速增长,如何借助分层技术实现在不牺牲系统性能和数据保护的情况下降低基础架构成本的技术一直备受关注。EMC Isilon支持不同存储层之间的数据迁移,这些存储层包括Isilon S系列(一级)、X(一级或者二级)和NL系列(二级或者三级)归档平台。但是,为了进一步降低“数据湖”数据归档的成本,EMC推出了CloudPool功能。CloudPool可以让Isilon轻松的扩展到公有云、私有云和混合云。企业中许多常年不使用的数据就可以被转移到云平台,这些平台包括AWS S3Azure BlobsEMC ECSVirtustream

 

Isilon可扩展其核心命名空间到云以后,可以在确保安全访问的前提下,让数据湖的规模扩展到云规模,并极大的降低数据湖的使用成本。

 

用一个成本比较就可以看出Isilon如何有效降低数据湖的使用成本。VNX存储每GB使用3年的成本为1美元,Isilon存储每GB使用3年的成本为0.5美元,ECS该成本则为0.2美元。

 



信胜科技

北京 010-82539930

上海 021-54561232

苏州 0512-65583086

天津 022-58697807

......

扫一扫