苏州胜网企业级云数据中心基础架构解决方案

0 评论

市场背景

      随着互联网的飞速发展,企业信息化步伐的不断加快,IT资源的应用和管理模式正发生着深刻的变革,它将逐步从独立、分散的功能性资源发展成以数据中心为承载平台的服务型创新资源。在这一背景下,数据中心已经成为像交通、能源一样的基础设施。

     数据中心已经经历了四十多年的发展历程,在信息技术进步和数据中心在企业和部门中的重要性不断提高的驱动下,其变化和发展的速度更是日新月异。未来,数据中心的数量和规模都将不断增大,复杂性也将不断增加,同时,各类应用需求会层出不穷。

所有这一切都使得传统数据中心无法满足现代数据中心的要求,尤其在大数据时代,已有数据中心正面临着建设成本高、周期长、能耗高、运营管理效率低、可扩展性差等问题,这些严重制约了企业的业务发展。

传统数据中心的问题主要体现在如下几个方面:

1)    成本高昂

2)     能源消耗巨大

3)     资源孤立且利用率低

4)     自动化程度与敏捷性差

传统数据中心vs云数据中心

    建设这样一个既能够提供AI服务、大数据服务、又能满足企业级核心业务需要的云数据中心,它的底层基础架构资源池究竟该如何搭建呢?

解决方案介绍

  那么现在就以建设一个千台规模的数据中心为例来进行介绍!

  首先把云数据中心的基础设施按照业务类型进行划分,如下图的这八类资源池,当然可以更多或更少:
  高密度虚拟化计算资源池
  这个比较好理解,主要是部署虚拟化。采用标准X86服务器,在单台物理机虚拟化的基础上增加集群的模式,将加入集群的众多物理机进行资源池化,统一调度管理。

  虚拟化主要适用于要求资源相对较少且规格种类多、可以重新分配调度资源的环境,便于资源的合理、充分利用,也便于后期业务扩展所需的资源动态调整。

  虚拟化计算资源包括: 
  通用型服务器:为运维管理、虚拟主机、内存对象缓存服务等提供基础计算能力;

  混合型服务器:为同时需要高IO和大容量存储的云服务提供基础计算能力,可使用SSD硬盘和SATA硬盘混搭的方式,利用SSD的高IO能力和大容量SATA磁盘各自优势;

  网络型服务器:为网络控制器、安全、负载均衡等高网络带宽要求的云服务提供基础计算能力。

  可根据选用虚拟化技术的不同划分为不同的虚拟化资源池,例如VMWare和KVM两个资源池区域。
  高密度虚拟化资源池按照业务用途可以分别连接共享存储及分布式存储,在多个机房分别建设,其中共享存储部分设计可以考虑具备双活能力,分布式存储考虑双中心互联。

  高性能分布式计算资源池
  高性能分布式计算资源池主要支撑数据仓库、大数据处理、结构化与非结构化数据应用,此类大数据处理操作对海量数据的查询、检索、分析、挖掘的性能要求高,适合用分布式并行计算框架进行计算。

  高性能分布式计算资源池,底层采用标准的X86服务器,通过部署集群管理系统,将各高性能计算资源按照集群进行整合,承载海量数据存储和实时查询分析任务,对外提供统一服务。

  分布式计算资源包含: 
  计算I/O型服务器:为分布式数据库服务、大数据计算服务等需要高I/O的云服务提供基础计算能力;

  计算存储型服务器:为运维管理、非结构化对象存储、离线计算服务等需要大容量存储的云服务提供基础计算能力。

  高性能数据库计算资源池
  高性能数据库计算资源池,针对传统业务中对Oracle等高性能数据库业务的应用需求,对服务器等硬件的CPU、内存、网络和存储性能有着严格要求,从而划分部分以物理资源为主的高性能数据库资源区,包括物理服务器和高性能存储阵列,为高性能需求的各类数据库服务,以及非结构化数据存储提供计算资源服务。
  高性能数据库资源池采用关键计算服务硬件架构,采用业界先进的高速互联设计,提供了强大的计算处理能力。系统中关键部件均实现容错设计,从芯片级、链路级、模块级、系统级四方面RAS特性,可靠性达99.999%以上。关键计算服务硬件性能强劲,稳定可靠,是信息化核心数据库系统的理想平台。

  异构计算资源池
  针对大量应用系统所需图像处理、深度学习等人工智能技术需求,而建设的异构计算资源池集群,主要是指带有GPU、FPGA、MIC等异构计算能力的服务器集群。

  深度学习技术是需要模拟人脑进行分析学习而构建深度神经网络,让机器能够像人一样思考,需要进行海量数据的模型训练和推理,对计算资源要求十分巨大。
  随着要处理数据规模的增大,GPU在高性能服务器上应用已逐渐成为现代数据中心规划的主流,GPU已广泛应用在图像增强处理、图像目标搜索、深度学习等领域。

  分布式存储资源池
  分布式存储基于SDS理念,在配置多块大容量硬盘的服务器上部署存储软件,对外提供块存储、对象存储、文件存储功能,为业务部门提供块存储和非结构化数据存储能力。

  非结构化数据宜采用分布式存储系统,典型如对图片数据、语音数据等。  
  分布式存储系统主要具有易扩展、超大容量及高带宽特点,通过软件定义存储引擎来承载各种软件功能,物理硬件资源与软件资源紧密配合,达到快速响应前端应用、存储大量数据的目的,解决了非结构化数据的数据量较大,在存储时对容量及系统带宽要求较高的问题。

  统一存储资源池
  关键数据存储和虚拟化重要业务应用存储采用共用集中存储的形式。

  共享存储基于SAN存储实现为传统应用提供数据库及虚机支撑,多中心间FC链路互联具备承载应用双活的能力。
  统一存储资源池可以利用共享存储丰富的软件功能,在存储端对数据进行优化:

  1)  共享存储具备自动精简配置功能。

  2)  共享存储具备热点数据自动分层功能。

  3)  共享存储具备存储虚拟化整合功能,能够对不同的存储孤岛进行统一整合管理,降低管理成本、提高灵活性和磁盘利用率、改进性能、以及简化迁移等目的。

  共享存储双活能力使数据能在数据中心之间共享、存取或移动,利用跨数据中心的存储虚拟化功能和数据镜像功能,结合上层应用集群,使两个存储系统都处于运行状态,可同时承担相同业务,提高数据中心的整体服务能力和系统资源利用率。

  网络资源池
  网络资源池采用SDN+NFV+VxLAN技术,通过在通用服务器上部署网络功能软件,实现虚拟网络功能,为支持OpenFlow协议的交换设备分发网络配置,实现网络的灵活定义。通过网络资源池化和大二层技术,虚拟机可以在各数据中心之间进行无用户感知漂移,实现网络即服务。
  多数据中心间采用两家不同运营商裸光纤互联,部署波分复用设备互联,应用跨中心集群部署,通过数据复制技术、跨中心共享存储技术和虚拟机迁移技术来保证各中心的数据一致性和应用双活。

  安全资源池
  安全资源池通过部署统一安全资源池通集成虚拟防火墙、虚拟化IPS等安全防护功能,通过软件定义安全,实现云平台南北向、东西向的安全防护。

客户收益

  这样建设的好处也非常多,如:

  1)  充分满足AI、大数据、虚拟化、关键计算等企业级典型云服务业务需求;

  2)  合理利用不同的硬件特点,为不同的云服务提供底层硬件支撑;

  3)  减少硬件浪费,并降低纯低端硬件的不稳定性和性能风险;

  4)  兼容现有架构的业务应用系统,例如基于Oracle等开发的业务系统;

  5)  降低业务大规模改造风险和时间成本,不必一刀切全部云化,当然如果需要直接进行业务分布式云化改造,也可以完全支撑;

  6)  适合企业级业务需求的数据中心建设架构;

后期扩展

     此方案一方面可实现较少工作人员对数据中心的高度智能管理,另一方面为后续的两地三中心的建设也提供了更加敏捷高效、成本可控的方案。

相关软件
胜网多云管平台是一个重要的工具,向下可以管理各种基础设施资源,向上支撑容器云或容器化 PaaS 平台,为容器化 PaaS 平台提供资源,而容器云或容器化 PaaS 只使用资源不管理和维护资源,使容器云和容器化 PaaS 平台专注于支撑业务应