本系列分为四个部分,在第一部分中,您将了解什么是私有云以及托管的“基础结构即服务”是如何支持该环境的。
云计算有很多定义,但其中比较简洁并得到广泛认可的一种定义来自美国国家标准与技术研究院
(NIST)。NIST 定义了五种基本特征、三种服务模型和四种部署模型。基本特征构成了该定义的核心。任何解决方案要成为真正的“云”解决方案,都必须具备以下特征:
按需自助服务
宽带网络访问
具有资源池
具有快速伸缩性能
可计量的服务
NIST 也定义了三种服务模型,有时称为体系结构层:
基础结构即服务 (IaaS)
软件即服务 (SaaS)
平台即服务 (PaaS)
最后,它定义了四种部署模型:
私有云
社区云
公共云
混合云
了解云
Microsoft 服务已使用 Windows Server、Hyper-V 和 System Center
设计、构建并实施了私有云/IaaS 解决方案。我们的目标始终贯穿本系列的四个部分,即向您展示如何集成和部署每个组件产品,使其成为一个解决方案,同时提供不可或缺的云特性,例如伸缩性能、资源池和自助服务。
在这第一篇文章中,我们将对私有云/IaaS 做出定义,描述用作要求的云特性和数据中心设计原则,然后详细介绍为满足这些要求而创建的参考体系结构。在第二和第三部分中,我们将介绍参考体系结构的详细设计,其中包含的每一个层和产品,以及流程和工作流自动化。最后,在第四部分中,我们将介绍使用
Microsoft 部署工具包和 Hydration Framework 创建的部署自动化,从而实现一致的、可重复的实施。
为了获得一致的云定义,我们将使用 NIST 部署模型。我们会经常在各种环境中使用“私有云”这个术语,而不指定所讨论的服务模型。
除了 NIST 定义中描述的特征以外,我们为此项目增加了一些附加要求:
复原能力比冗余更重要
均化和标准化
资源池
虚拟化
结构管理
伸缩性能
共享资源分配
成本透明性
Microsoft 的团队收集并定义了这些原则。该团队分析了以下组织:运营我们庞大的数据中心的全球基础服务
(GFS) 组织;运营 Microsoft 内部基础结构和应用程序的 MSIT;以及同意参与此项研究的一些大客户。随着所述的定义和要求被接受,我们进入到体系结构设计阶段。在此,我们进一步定义了这些要求,并创建了体系结构模型来实现这些要求。
私有云/IaaS 参考体系结构
使用我的另一篇技术文章“从虚拟化到动态 IT”(The Architecture Journal,2010
年 6 月)中所述的体系结构方法,我们决定将图 1 所示的模型作为参考体系结构的基础。
图 1 参考体系结构的基础。
硬件层
硬件层包括数据中心设备和机械系统,还有存储、网络和计算基础结构。其中的每个元素都必须提供有效的管理接口,以便与更高的体系结构层级交互。具体的示例包括:支持
Web 服务管理 (WS-Management) 的服务器以及提供 Windows PowerShell
或存储管理计划 - 规范 (SMI-S) 接口的存储阵列。
Microsoft 声称其制定的 Microsoft Hyper-V 云快速跟踪计划,目的是为了与 Microsoft
软件、整合指南、OEM 合作伙伴为计算、网络和存储提供的验证配置以及增值软件组件相结合,以便创建私有云解决方案。Hewlett-Packard
Co.、Dell Inc.、IBM Corp.、Fujitsu、Hitachi Ltd. 和 NEC Corp.
都是快速跟踪合作伙伴,并且为硬件层提供经过集成和验证的解决方案。
虚拟化层
Windows Server 2008 R2(目前为 Service Pack 1)和 Hyper-V
提供了虚拟化层。这可以让我们将虚拟机 (VM) 和网络与 VLAN 结合使用,并通过对共享卷和虚拟磁盘进行群集操作来提供存储。虚拟化层帮助我们实现了
NIST 的几种基本特征,例如资源池和伸缩性能。通过虚拟化,我们就能更快地共享和设置容量。
自动化层
从下往上,自动化层是堆栈中的下一个层(请参见图 2)。就 IT 流程自动化来说,自动化层、管理层和业务流程层是从最精细逐步演变到最广泛。最底层为自动化层,包括像
Windows PowerShell 2.0、Windows 管理规范 (WMI) 和 WS-Management
这样的技术。这些基础技术为高层管理系统与物理和虚拟资源之间提供接口。
图 2 用于私有云模型的从下往上的体系结构模型。
管理层
管理层由一些 Microsoft System Center 产品组成,这些产品利用自动化层的技术来执行管理任务,例如:检查修补程序符合性、部署修补程序和验证安装。管理层提供基本的流程自动化,但通常仅限于服务器管理生命周期的一个方面(如部署、修补、监控和备份等)。
业务流程层
在传统的 IT 环境中,通常不会看到业务流程层,但是它对提供云特性却至关重要。业务流程层绑定多种产品、技术和流程,以便实现端到端的
IT 流程自动化。虽然 System Center Configuration Manager 可以自动执行修补程序部署,但是要将其与服务管理系统或附加的第三方产品和解决方案集成,仍需要业务流程层来协调跨越多个产品的端到端流程。
对于这一层,我们使用 System Center Opalis(不久将被命名为 System Center
Orchestrator)。Opalis 集成了 System Center 套件,也方便了与许多第三方和合作伙伴解决方案的集成。业务流程层帮助我们创建工作流或运行可自动执行复杂任务的脚本,例如群集部署、主机修补和
VM 设置。
用户自助服务和管理员界面
对于很多 IT 组织来说,NIST 定义的按需或自助服务特性还是一个新概念。此概念主要是为了消除用户对
IT 资源的需求与这些资源的供给之间的障碍。例如:在一些组织中,从收到需要新服务器的请求到实际配备新服务器,时间可能要长达
6 个月之久。这种延迟是由流程和技术的局限性导致的。
自助服务功能需要一种新型界面来让用户请求服务。此界面通常由 IT 自助服务门户控制。此门户会为用户显示一个服务目录,用户可在此请求服务项目,如新的
VM。
在参考体系结构中,我们定义了针对消费者的自助服务界面和针对 IT 人员的集中化管理员界面。对于消费者界面,Microsoft
提供了 System Center Virtual Machine Manager (VMM) Self-Service
Portal 2.0;对于自定义方案和主机托管服务提供商,提供了主机托管服务提供商动态数据中心工具包 (DDTK-H)。对于我们的解决方案,由于一些必要的自定义和自动化,我们使用了
DDTK-H 的自定义版本。我们预计未来的 Microsoft 产品将提供更方便的现成的解决方案。
对于管理员界面,我们使用了 System Center Service Manager (SCSM)
和 System Center 界面。SCSM 是最新的 Microsoft System Center
产品。它提供了一个配置管理数据库 (CMDB) 和一个强大的变更管理解决方案。在我们的解决方案中,所有常用操作都源自
SCSM 内的变更请求。这些请求会在 Opalis 中触发自动化工作流。因此,我们既能确保适当的变更管理,又能提供高级自动化。
私有云/IaaS 逻辑模型
传统数据中心和服务器环境与私有云之间的主要区别之一是物理资源(如服务器、网络和磁盘)的抽象性。这些资源都存放在更高级别的逻辑分组中,例如资源池、故障域和升级域等。这些逻辑分组都映射到物理基础结构,并帮助您做出明智的设置和管理决策。基于由
Microsoft 全球基础服务、Windows Azure 和 MSIT 完成的工作,我们的参考体系结构使用了一种逻辑模型(请参见图
3)。
图 3 私有云/IaaS 的逻辑分组模型。
下面是各个对象的定义:
IaaS 结构:结构是指参考体系结构内的所有基础结构和系统。结构可包含多个站点和数据中心。
数据中心/站点:承载一个或多个资源池的物理位置或站点。
资源池:资源池由共享通用硬件和配置基线的服务器、网络及存储扩展单元组成。但它们不与其他任何资源池(非设备本身)共享单点故障。您可以把资源池进一步细分为故障域,在故障域的定义下,共享通用配置的一组物理基础结构不与其他任何故障域共享单点故障。为了方便起见,在我们的解决方案中,资源池和故障域是等效的。
扩展单元:扩展单元是指作为一个单元部署的一组服务器、网络和存储容量。它是部署在结构中的最小容量单元。根据客户的规模,扩展单元可以是
4 个节点的 Hyper-V 群集或整个机架的 64 台刀片式服务器。它通常需要按照半年内所需的新容量平均值来调整大小。当您需要更多容量来满足需求并留出扩展空间时,就可以部署一个新的扩展单元,而不是一次部署一台服务器。
主机群集:主机群集是指故障转移群集配置中的一组 Hyper-V 服务器(2 到 16 台)及其关联的网络和存储。
升级域:升级域是指您在资源池中可以维护的一组基础结构,当其脱机或升级时,不会使资源池中运行的
VM 或工作负载停机。在此体系结构中,所有群集内位于资源池 1 中的每个节点 1 都构成一个升级域。因为每个群集都有一个备用节点(15
加 1),所以无需停机,就能对每个群集中的一个节点进行维护(维护之前必须先实时迁移 VM)。因此,资源池中的所有节点
1 都被定义为升级域 1;所有节点 2 都被定义为升级域 2;以此类推(请参见图 4)。
图 4 带有子扩展单元的资源池。
定义和实施这些容器的原因是,这样您就可以自动执行智能设置和管理。例如:对于一个含四台服务器的 Web
场,在站点出现故障时,要确保至少有一个站点具有高可用性。只要确保将设置请求分配到两个站点以及两个或更多资源池中即可。资源池的定义以及它们到物理基础结构的映射可以确保实现这一点。正确布置
VM 即可获得服务复原能力。
经验丰富的 System Center 用户会注意到,这里所描述的容器和定义都不是 System Center
本身提供的。我们运用 SCSM CMDB 的可扩展性来定义这些容器、特性和关系。Opalis 工作流自动化的输出就基于这些内容。将来,许多容器和关系都将内置到
VMM 2012 中,但是会采用不同的命名约定。
私有云/IaaS 参考实现
在 VM 托管平台提供的管理平台中,逻辑和物理的分离有助于单独进行各项扩展(请参见图
5)。图 5 中表格的中间位置显示了管理系统范围内、可由整个解决方案部署到现有数据中心中的资源池。
图 5 如何实现体系结构的逻辑图。
参考实现的关键元素之一是自动部署,它可以提高部署速度和实施的一致性。这是 Microsoft 服务与大量合作伙伴和客户通力合作的成果。对于部署自动化,参考实现包括免费的
Microsoft 部署工具包 (MDT) 和 Microsoft Services Hydration
Framework。参考实现在 MDT 基础上提供了更多部署自动化。
设计流程的下一步是找出所有需要详细设计的区域。这些改进包括:
每个 System Center 产品的详细设计
结构管理托管基础结构的详细设计
结构管理设置
扩展单元设计
扩展单元设置
工作流设计
参考体系结构为每一个 NIST 云特性提供一个解决方案,并且提供了可实现高级
IT 自动化的引擎。在选择在哪种情况下自动化时,我们专注于用户容易出错的高度复杂、高成本和高风险的方案。为此,解决方案会自动执行以下过程:
结构管理安装:
结构管理 Hyper-V 主机部署
虚拟化 SQL 群集部署
VMM 部署
SCSM 部署
System Center Operations Manager (SCOM)
部署
System Center Configuration Manager
(SCCM) 部署
System Center Opalis 部署
自定义和配置
扩展单元(主机群集)设置:
裸机操作系统安装
Hyper-V 安装
群集配置
扩展单元(主机群集)修补:
每个升级域都使用 VMM 维护模式和 SCOM 维护模式来安排将 VM
实时迁移到主机外以供修补
安排 SCCM 以修补主机并验证修补是否成功
从维护模式中删除主机并转移到下一个升级域
主机维护:
安排将 VM 实时迁移到主机外时,需要使用 VMM 维护模式和 SCOM
维护模式进行维护
从维护模式中删除主机
VM 设置:
通过门户界面提供 VM 设置功能
Opalis 接受设置请求并且从预配置的模板协调 VM 设置
Opalis 确保 VM 已创建并且对所有 System Center
产品可见
Opalis 在请求的 VM 中安装 SCOM 代理
门户界面中已经显示 VM,并且可以对其进行管理
取消 VM 设置:
从门户界面中请求取消 VM 设置
Opalis 执行取消设置请求并从 System Center 产品中去除
VM,然后删除 VM
Opalis 删除 VM 的 Active Directory 计算机帐户和
DNS 的 A 记录
在这一系列课程的下一部分,我们将深入了解结构管理体系结构的详细设计,包括结构管理的
Hyper-V 群集设计、虚拟化的 SQL 群集设计以及每个 System Center 产品的设计。还将演示由含
16 节点的 Hyper-V 群集组成的扩展单元设计。
|