VMworld 2015对VSAN说了些啥? (附赠:Oracle RAC在VSAN上的性能)
VMworld 2015对VSAN说了些啥?
说了如下九大特性:
一、VSAN支持存储双活 (Stretched Cluster)
二、VSAN支持多核虚拟机的容错 (SMP-FT)
三、VSAN容灾技术的RPO最低可达5分钟
四、VSAN支持两节点的VSAN集群(用于远程或分支办公室)
五、VSAN支持Oracle RAC和 WSFC集群技术(附:VMware中国POC, Oracle RAC在VSAN上的性能)
六、VSAN支持ULLtra DIMM SSD和NVMe SSD
七、VSAN健康检查插件(Health Check Plug In) 第二版更新
八、VSAN for vRops 管理套件
九、VSAN支持云环境原生应用(Cloud-Native Application)
下面便一一道来:
2015年8月31日,VMworld 2015大会上,正式发布了VSAN 6.1版。VSAN是为HCI (超融合架构) 定制的软件定义存储。HCI发展有多迅猛,我们先来看下IDC最新做出的预测:平均60%的年复合增长率!
这次是VSAN的第3个版本。从VSAN发售以来,短短15个月里,就积累了超过2000多个用户。笔者记得在上一家初创的美国存储公司时,公司积累了好几年,才超过1000个用户。因为存储是用户信息存放之地的根本,用户一般不会轻易更换存储,VSAN的用户增长这么快,已经难能可贵了。
VSAN的部署已经横跨全球各种规模和各种行业的用户IT环境了,这些用户逐渐信任在VSAN上运行他们的关键业务应用,例如国内就有金融、政府、教育等行业在其生产系统中使用VSAN了。VMware会持续提供更高性能,更易扩展,更高可靠性的企业级存储给虚拟环境下的工作负载,包括生产应用和关键应用。
例如,VSAN 6.1 通过为多核虚机支持Fault Tolerance,增强方案的容灾能力(RPO缩小到5分钟),以及支持存储双活(Stretched Cluster),使得VSAN成为具有更高企业级可用性和数据保护能力的平台。VSAN的核心是,确保数据永不丢失。
下面我们就VSAN 6.1的九大新特性展开来介绍。
一、VSAN Stretched Cluster (存储双活)
VSAN 6.1 能够在两个位于不同地理位置的站点之间,通过同步地复制数据,建立Stretched Cluster (延伸集群)。这实际上为vSphere虚机提供了低成本高可靠的双活存储,提供了持续的可用性。
与其他外置磁盘阵列的双活方案(如EMC VPLEX,DELL Compellent Live Volume等)类似,对于网络的要求比较苛刻,两个站点之间数据同步要求高带宽低延迟,VSAN也要求5ms (毫秒)以内的延时。
另外,VSAN的延伸集群,还需要Witness节点,这个节点只存放元数据,不存储业务数据,它的作用是和两个站点建立心跳机制,当其中一个站点故障或站点间发生网络分区的时候,Witness可以判断出发生了什么,并决策如何确保可用性。
而Witness的节点与其他两个站点之间的延时可以在100ms以内。Witness节点不一定非得运行在物理的 ESXi 主机上,也可以运行在第三个站点的虚机上,或者可以运行在公有云vCloud Air上。VMware已经准备好了特殊的Witness虚拟设备(witness appliance),实际上就是装有ESXi的虚机。
二、VSAN6.1支持多核虚拟机的容错 (SMP-FT)
VSAN 6.1开始,能够支持vSphere的Fault Tolerance功能,并且最多可达4个CPU,提高了关键业务应用在硬件故障(如主机故障)下零停机的持续可用性。这一技术,具有重要的意义,在一定程度上,可以弥补某些应用所缺乏的集群高可用性,也以vSphere的集群高可用和VSAN的高可用(多副本)来部分替代以往成本高昂的应用高可用的方案。
三、VSAN容灾技术的RPO最低可达5分钟
VSAN 6.1 利用 vSphere的Replication技术实现了数据复制(容灾)。RPO从以前版本的最低15分钟,缩小到5分钟。VMware Site Recovery Manager (SRM) 能够利用其构成完整的灾难恢复解决方案。
四、支持两节点的VSAN集群
对VSAN5.5和VSAN 6.0比较了解的朋友知道,那时VSAN至少需要三个以上的节点(FTT=1,也即最大允许的故障数为1时) 。在新发布的VSAN 6.1里,用户可以部署两节点的VSAN集群。这样就为ROBO(远程办公室和分支办公室)这种员工存储经验有限的站点,提供了了便利。
ROBO的VSAN也可以被远程的vCenter集中管理起来。需要注意的是,实际上仍然是3个节点,第三个做为Witness的节点可以位于主数据中心的虚机上,或者公有云vCloud Air上,这与前面提到的VSAN Stretched Cluster对于Witness的要求类似。
五、VSAN6.1 支持OracleRAC和 WSFC集群技术
VSAN 6.1 现在支持包括Oracle RAC (Real Application Cluster) 和Windows故障转移集群(Windows Server Failover Clustering)。借助于VSAN的特性,使得Oracle RAC用户、Windows故障转移集群的用户能够拥有更高性能、能在线扩展、更高可靠性的存储。
Oracle RAC在VSAN上的性能
以Oracle RAC为例。在6、7月份的时候,笔者配合VMware中国的合作伙伴为某大型金融行业的用户,搭建了一个VSAN的POC环境。采用业界认可的SwingBench压力测试工具,逼真模拟电商业务中常见的4种交易:Customer Registration, Browse Products, Order Products, Process Orders,按500并发用户加压,以普通的四台服务器(每台服务器含有1块Toshiba SAS eMLC SSD和4 块600GB 15K SAS)的配置,获得了12592 TPS,延时ART=40ms的优异性能。
据笔者所知,之前有一款全闪存外置磁盘阵列,采用了12块更为昂贵的SLC SSD,也仅仅获得了12542 TPS,延时ART=38ms。相比之下,VSAN无疑具有更高的性价比。
更重要的是,VSAN能够与vSphere的其他功能紧密集成,例如vMotion、HA等。
如果大家有兴趣的话,可以关注【DT时代】,查看历史文章《从U2VL到SDDC数据中心不再靠天吃饭》,可以看到VMware中国U2VL团队的POC测试中,vMotion仅仅耗时19秒,在这短短19秒期间,SwingBench模拟的电商业务不中断,仅有轻微延时影响。
六、VSAN支持ULLtra DIMM SSD和NVMe SSD
借助灵活的软件定义的存储解决方案所具有的优势,VSAN能在最新的时间内最快兼容业界新的标准硬件技术,不断地为用户增加新的硬件配置和选择。
VSAN 6.1支持:
1)基于ULLtra DIMM 的SSD
通过 DIMM 插槽将闪存存储与内存通道连接起来,可以实现非常低(小于 5 微秒)的写延迟。这种SSD能提供更高的性能,以Diablo的exFlash DIMM为例,仅一块DIMM卡,随机4K读能达到14.2万IOPS,随机4K写能达到4.4万IOPS。OLTP 4K的读写混合高达7.2万!这个性能已经非常之高了。笔者虽然没有亲自测试过,但下面的Diablo官方规格表,也可以看出其性能之猛。
2)NVMe SSD
NVMeSSD是一种改进了通信协议的全新SSD,通过更高的并发,可以实现更高的固态硬盘性能。根据下图,我们可以看到,与以往PCIe SSD普遍采用的AHCI协议相比,NVMe具有更低的延迟,并通过其并行处理机制,能提供更高的性能。
利用NVMe SSD,VSAN 32个节点的全闪存集群,能达到320万IOPS,也即每个节点约10万IOPS。
以前面提到的POC为例,后来用户想观察NVMe SSD的性能,合作伙伴利用同样的环境,只是将SAS SSD换成了NVMe SSD (GreenliantG-Card),在1000并发用户数下,获得了高达17784的TPS!
后续笔者还会有更详细的文章,介绍VSAN实测的性能数据,以及Oracle RAC在VSAN上运行的状况,欢迎持续关注这个微信公众号。也欢迎厂商提供测试环境,尤其是服务器 : )
七、VSAN健康检查插件(Health Check Plug-In)第二版更新
VSAN Health Check Plug-In是一个免费的vCenter的插件,紧密的集成在vSphere Web Client图形界面内,可用于对硬件、固件和驱动器兼容性进行检查(检查是否在HCL认证列表内),提供网络诊断和实时诊断,并能让集群中的高级配置选项确保一致。
这个工具非常强大,能自动测试虚机的创建,组播的性能,甚至能自动生成多个虚机进行加压测试,检查各个指标是否在合理范围内。强烈建议进行VSAN测试或者VSAN部署时,首先要做的工作,就是安装这个插件,并逐项运行,确保硬件、软件、配置、限制、性能是否正确或者合理。
很自豪地告诉大家,这个插件也是VMware中国研发团队研发的。其实,VSAN整个全球研发团队中,有40%以上的研发人员在中国。对于中国用户而言,这也是VSAN的一大优势。
八、VSAN for vRops 管理套件
VSAN for vRops (VSAN Management Packfor vRealize Operations) 是指VSAN与 vRealize Operations 紧密集成,提供一整套管理功能,可减少故障排除工作、提高监控效率并支持跨 VSAN 集群的全局可见性。
具体来说:
vRops可以在全局的视图中,管理多个VSAN集群;
自动形成虚机、主机、磁盘组的拓补图;
VSAN性能的预测分析,VSAN容量的发展趋势和规划建议;
查看路径或设备是否丢失,硬件是否出故障;包括SSD损耗平衡的程度等;
举例来说:通过“HeatMap”仪表板,可以快速的了解每一个IO控制器、SSD盘、机械盘的性能(包括带宽、IOPS和延时)等信息;
借助智能预警(Smart Alerts),vRops能够结合多个症状,专注在本质问题,生成一个单一的预警,并提供清晰的建议和治理(解决问题)的行动选项。
九、支持云环境原生应用(Cloud-Native Application)
VSAN支持云环境原生应用:VSAN 数据存储现在可用于向位于Docker 容器内的应用提供永久性存储能力。
十、VSAN预览版:支持Erasure Coding和Deduplication
下一步,VSAN将要支持Erasure Coding和Deduplication(重复数据删除)。
Erasure Coding将显著提供磁盘空间的利用率。当前,VSAN支持多副本(如RAID 1)的方式来存放虚机的对象。未来,将提供类似RAID 5或RAID 6,也即Erasure Coding的方式来存放虚机的对象。
实际上,VSAN6.1还有些小的改进,例如:All Flash Enhanced usability UI和Virtual SAN On Disk Format Upgrade。
All Flash Enhanced usability UI使得用户在图形界面里,即可表示缓存层和持久化层,以往全闪存模式下,用户需要进入命令行,才能将读密集型SSD标识成持久化层;
Virtual SAN On Disk Format Upgrade使得用户在图形界面里,使用鼠标单击,即可将VSAN文件系统的格式进行升级。
原以为从VSAN 6.0到VSAN 6.1,不会有太多的更新,没想到不到半年的时间,VMware在VSAN上竟然有了如此多的改进和增强。关注VMworld 2015的朋友也会发现,不仅VSAN如此,VMware的其他软件也增加了许多新的功能。例如Cross-CloudvMotion在私有云和公有云之间实现vMotion功能,标志着VMware成了一个真正的混合云方案提供商。
[转载于乐生活与爱IT]
微信名:
HadoopSummit
微信ID:
hadoopinchina
中国Hadoop技术峰会是亚太地区举办最早、规模最大、影响力最广阔的大数据盛会。
Chinahadoop.com是China Hadoop Summit的内容网站。
HadoopSummit是Chinahadoop.com的微信发布平台。