有没有能替代VMware的国产服务商推荐?
无论采用哪种技术路线、哪种方案和产品对现有 VMware 环境进行替换,都不能 100% 保证在功能特性和使用体验方面的完全一致。因此,最终的替换决策必然是在认真评估后做出的主动调整:放弃部分非核心、不必要的功能,或通过应用层、架构层的改造以达到同样的效果。
可用于 VMware 替换的技术路线
1、聚焦替换 vSphere 并兼顾存储
虚拟化基础设施的核心是 Hypervisor 和存储。
首先,从 Hypervisor 技术和产品角度考虑:有可能用于填补 vSphere 空白的国内虚拟化产品都是基于 KVM 进行的开发。我们从 IDC 发布的“2020 年中国软件定义计算市场份额”中看到,有潜力成为 vSphere 虚拟化产品替代者的,是榜单上的华为、新华三、浪潮。2022 年 Gartner “Market Guide for Server Virtualization” 中则仅提到了华为和深信服。
再考虑虚拟化环境中使用的存储:在国内用户的 vSphere 部署中,大部分采用了集中式 SAN 存储与之配合。那么,替换 vSphere 的方案,也必须包含对集中式 SAN 存储部分的考虑。比如,既有 SAN 存储产品是否为国外品牌?是否在 vSphere 替换的同时,将 SAN 存储也替换为国内自主研发的、符合信创要求的产品?
2021 年上半年的 IDC 报告列出的中国企业级外置存储市场排名前三的华为、新华三和浪潮,采用的都是全自研的存储产品。在 vSphere 的国内部署中,已经有很大部分用户采用了这些国产存储产品,以国产存储替代国外同类产品,并不存在障碍。对于这一部分用户,首先考虑选择成熟的 KVM 虚拟化软件作为 vSphere 的替代者。虚拟化与存储之间通过 iSCSI、NFS 等标准接口连接,这就为保留现有国产集中存储、并逐步将非国产存储产品进行替换创造了条件。
针对这个方案需要注意的两点是:
虽然目前国内 IT 厂商具备了自主研发中端存储的实力,但之前大多基于 x86 平台,并非符合信创要求的产品。而基于海光、鲲鹏、飞腾等国产 CPU 的硬件,则需要全新的设计。从“国产存储”到“信创存储”,整个产品的成熟和迭代周期会比较长。
由于 SAN 存储系统的复杂性,应对企业数字化业务快速增长的弹性需求已经捉襟见肘,目前 SAN 存储的分布式和软件定义转型也已经是大势所趋。这时也可以选择支持 vSphere 虚拟化的国内超融合厂商,先完成存储部分的转型和替换,再逐步实现对 vSphere 的替换。
2、置换为超融合 HCI
在虚拟化和存储的改造过程中,有些用户也有可能将“虚拟机与外置存储分离部署”的方式替换为更加简单、弹性敏捷的超融合(HCI)方式。在这个领域,IDC 2021 年排名靠前的国产自主研发的超融合产品分别来自华为、新华三、深信服、浪潮和 SmartX,其中 SmartX 作为唯一独立的超融合厂商,在金融行业超融合软件市场占有率排名第一, 以良好的口碑被 IDC 评价为“在金融行业得到青睐”。
从 SmartX 等厂商的金融行业案例可以看到,对于现有基础架构为 vSphere + SAN 存储的用户,将其替换为国产超融合方案已经得到生产环境的验证。同时,选择国产自主研发的超融合产品不仅意味着实现 VMware 替换,更能实现从传统架构到分布式架构和软件定义方式的转型——简化了虚拟化计算和存储的层次结构,落地容易,弹性很好,按需扩展(通常 3 个节点起步),风险更低。
超融合架构除了具备软件定义和分布式架构带来的优势,因为包含了虚拟化、存储这两个核心组件,可以同时实现虚拟化层和存储层的信创替代。从信创角度看,国产超融合方案普遍基于标准的信创服务器,实现了软硬件的解耦,可以快速地适配。随着信创产品的不断升级,标准化的服务器和软件也都可以快速迭代。同时,分布式的架构通过软件方式解决系统冗余问题,还能提升整个资源池的性能,减少了信创 CPU 在性能上目前的不足。
3、转向整体私有云方案
国内的整体私有云解决方案大部分以 OpenStack 为基本技术栈进行开发。OpenStack 基于大量开源项目组成,并经过各个厂商的商业开发,形成了多种商用云方案。OpenStack 全面的云方案可以同时管理 IaaS 层的资源池(服务器、存储和网络),将不再需要分别从计算、存储或网络的角度考虑对 VMware 的替换路线图,而是从整体“私有云”维度进行重建。
根据 IDC 2021 年发布的软件定义计算软件市场半年跟踪报告,华为、新华三、浪潮、EasyStack 和九州云,在主要体现 OpenStack 技术路线的“云系统软件”分类中排名前五。
基于开源 OpenStack 方案的一个优势是,可以快速从社区获得最新的功能。在 OpenStack 社区贡献度排行榜上,国内云企业近年来也名列前茅。
不过目前基于 Openstack、Ceph 构建的私有云方案,由于模块众多、商用化程度有限、稳定性欠佳,因而大部分部署在开发测试环境,不能实现对用户架构的真正统一,没有真正达到用户云化转型的预期效果,在热度过后,理性用户已经开始更加谨慎地选择类似的架构。
4、依托公有云技术栈的专属云
专属云(Dedicated Cloud)是以公有云为基础,面向特定行业、特殊需求的云客户,提供全栈资源池的专属解决方案。专属云客户可以选择在公有云上独占机架、服务器和网络,通过基础设施隔离获得资源的专属使用权和安全性,但专属云的建设和运维仍交由公有云提供商承担。专属云打消了国内用户对公有云资源共享模式带来的安全合规、数据私密性等一系列顾虑,也在规模化部署、快速交付和集中运维方面享有了公有云深厚技术底蕴带来的福利。国内的主要公有云服务商都可以提供专属云服务,通常面向规模较大的国企、央企、集团公司、金融等行业。
由于专属云所依赖的公有云技术在管理平面的开销较大,起步即要求几十个节点(管理节点的要求)。这导致专属云的首次投入占比大,而且普通用户往往不具备运维这种规模的云平台的能力。除了大型客户以外,其他客户很难承受其巨大的投入和运维压力。
完整版可参考知乎专栏文章:生产级 VMware 虚拟化方案替换路线与评估
蓝海大脑作为深度学习、高性能计算研究领域的专家认为:
深度学习服务器/工作站,不能单独考虑硬件配置高低,以及预算多少,要根据使用者的类型,配置合理的硬件,硬件配置至少分为两个类型:
一、深度学习开发工作站/服务器
基本要求:
1)处理器:8核或以上
2)内存:64G内存或以上
3)GPU:1-4块GTX1080Ti,GTX Titan XP/V,Quadro GP100
4)系统硬盘:选用高速的SSD固态硬盘
二、深度学习训练工作站/服务器
基本要求:
1)处理器:8核或以上
2)内存:128G内存以上
3)GPU:4-10块Tesla系列GPU(K40,K80,P100,V100)
4)系统硬盘:选用高速的SSD固态硬盘组阵列(工作站:要求噪音小,适合办公室使用,服务器:要求密度高,噪音大,一般适用于机房)
0条评论