云计算工程
上QQ阅读APP看书,第一时间看更新

1.1 云计算的演进

云计算通过互联网以服务的方式提供动态可伸缩的虚拟化资源。技术的发展、商业模式的转变以及需求的驱动是云计算产生和迅猛发展的三大基石。首先,从技术角度来讲,云计算是并行分布式计算技术理念的自然延伸。与传统的集群计算、网格计算和超级计算相比,云计算通过集中式虚拟化计算、软件及数据等服务,使信息化系统从用户中分离出来,由专业的服务商提供,降低用户应用门槛。其次,从商业模式来看,它利用高速互联网的传输能力,将数据的处理从个人计算机或服务器转移到大型的计算中心进行,然后将计算能力和存储能力当作服务来提供,并按使用量进行计费,如同大家熟知的电力、自来水的使用一样,同时提高用户和服务提供商的经济效益。最后,各企事业单位信息系统数据量每年成倍数地在快速增长,因此带来上百万元乃至千万元的软硬件投资。合理使用资源、降低运营成本等社会日益增长的需求与成熟的技术、新的商业模式共同导致云计算的产生和迅猛发展。这将打破传统IT产业布局,开辟一个崭新的充满机遇的市场。

1.1.1 技术的发展

云计算环境是计算与存储并存的网络环境,上面承载云平台和云服务。其中,云平台是支撑海量信息处理的服务器和存储系统。而云服务提供多种多样的应用软件、业务和服务,如社区、搜索和商务等。用户通过各种终端和网络接入与使用云服务。因此,云计算的发展首先是被信息通信技术的形成、发展、融合以及相关标准的快速发展所推动的。

一、通信技术的发展

通信技术(Communication Technology, CT)是将信息从一个地点传送到另一个地点所采取的方法和措施的总称。一般来说,通信技术的发展历程可以划分为4个阶段:技术准备阶段、内容服务阶段、Web 2.0阶段以及移动互联阶段。

第一阶段,从1876年到1989年的技术准备阶段。众所周知,早在1876年,亚历山大·贝尔发出世界上第一条电话信息,揭开人类历史上以有线电话为主的远程通信时代。1901年,伽利尔摩·马可尼在英国与纽芬兰之间(3540km)实现横跨大西洋的无线电通信,使无线电达到实用阶段。至1963年,利克里德尔(J.C.R Licklider,1915~1990)提出了星际计算机网络(Intergalactic Computer Network),预见所有机器将构成网络,人能同时与所有计算机互动并获得超越性的信息处理能力。这是最早的全球计算机互联网络的构思。1969年,作为现代互联网前身的阿帕网(ARPANET)诞生,该事件入选2009年外国媒体评IT历史十大里程碑之一。而阿帕网诞生的原因,根据时任ARPANET高等研究计划署主任Charles Herzfeld的解释,是因为当时只有数量非常有限的、能力强大的大型计算机用于科研,而分布在美国各地的很多研究人员要访问这些资源非常不方便。无论是设计的初衷、提出的概念、还是实现都与现在的云计算中的“云”如出一辙。1978年,传输控制协议/互联网互联协议(Transmission Control Protocol/Internet Protocol, TCP/IP)得到了标准化认可。TCP/IP定义了电子设备如何连入互联网,以及数据如何在它们之间传输的标准,成为互联网最基本的协议。1986年,第一条骨干TCP/IP线路—美国国家科学网(NSFNet)—建成,NSFNet的网络速率为56Kbit/s,连接6个科研教育服务的超级计算机中心,使得相关研究人员能够共享研究成果并查找信息。1989年,欧洲核研究组织(CERN)开放第一条外部数据通道并提出万维网原型。

第二阶段,从1990年到1999年的内容服务阶段,此阶段的特点是网络即内容,通过HTML提供各种消息服务,如1990年的Archie、1994年的Yahoo、1996年的Sohu、1998年的Sina等。同期我们也见证了1997年到2000年的互联网泡沫,如1999年亿唐网由5个哈佛MBA毕业生和2个芝加哥大学MBA毕业生组成的“梦幻团队”创建,融资5000万美元,却由于定位混乱,在贪大求全却毫无特色的内容服务中渐渐全面收缩阵线,经历无数次转移后最终走向失败。

第三阶段,从1999年到现在的Web 2.0阶段。Web 2.0是相对Web 1.0的新的一类互联网应用的统称。Web 1.0的主要特点在于用户通过浏览器获取信息。Web 2.0则更注重用户的交互作用,用户既是网站内容的浏览者,也是网站内容的制造者,即互联网上的每一个用户不再仅仅是互联网的读者,同时也成为互联网的作者。此时,用户参与模式由单纯的“读”向“写”以及“共同建设”发展,用户由被动地接收互联网信息向主动创造互联网信息发展,从而更加人性化。同期还见证了一类特殊的互联网寄存服务即网页寄存(Web hosting)服务的出现与发展。网页寄存提供个人、组织和用户用于存储信息、图像、视频或任何通过网络可访问内容的在线系统。在经历了互联网泡沫的洗礼后,互联网的发展渐入理性。此阶段的特点是网络即平台,网络的主旨在于提高用户体验、参与度、信任度等,如1999年创建的Salesforce.com、携程网、2002年的Amazon Web Services、2003年的淘宝、2004年的Facebook、2005年的人人网。再到后来2006年的Amazon弹性计算云(Elastic Compute Cloud, EC2)平台,2009年的Google App Engine等,这些后来都发展为国内外知名的云计算提供商。

第四阶段,从2007年至今蓬勃发展的移动互联网阶段,其特点除了包含Web2.0的高用户体验、参与度、信任度外,还包含便捷、无处不在等优点。移动通信技术自1980年以来已经经历了第一代(1G)、第二代(2G)、第三代(3G)以及已经进入我们日常生活且日渐普及的第四代(4G)。其中,1G以频分多址制式提供普通模拟电话等话音业务。2G实现语音信息以数字化方式传输,并引入了短信、电子邮件等功能。3G采用蜂窝移动通信技术支持高速数据传输,能够在全球范围内实现无线漫游,并支持图像、音乐、视频流等多种媒体的传输。4G采用全数字全IP技术,支持分组交换。同时,4G可集成不同模式的无线通信,从无线局域网、蓝牙、蜂窝信号、广播电视到卫星通信,支持移动用户自由地在不同的无线通信网络中无间断地切换。基于这个技术,可实现快速上传现场信息(如监控图像)到相应的数据处理中心,以做出及时准确的决策。4G对云计算及其相关联产业的发展起到了极大的推动作用,为实现云计算的便携、无处不在的网络接入提供了关键的技术支撑。

二、信息技术的发展

狭义的信息技术(Information Technology, IT)是指利用计算机、网络、广播电视等各种硬件设备、软件工具和科学方法,对文、图、声、像等各种信息进行获取、加工、存储、传输与使用的技术之和。当代信息技术有着广泛的应用领域,如各种各样的内容服务、集成制造、决策支持等。云计算首先是一种信息技术。美国国防部供应商NJVC公司在2014年父亲节上致谢6位云计算之父,其中第一位就是图灵奖得主、美国麻省理工学院科学家约翰·麦卡锡(John McCarthy)博士。早在1961年麦卡锡博士就提出:“某天计算可能被组织成为一种公共效用,就像电话系统一样,每个订阅者只为自己实际使用的容量付费,但是他可以接入非常大的系统所提供的所有编程语言的特性……某些用户可能提供服务给其他用户……计算机公共事业可能成为一个新的和重要的产业基础。”这些话预见性地描述了今天如火如荼地发展着的云计算,这在谷歌之前、在互联网诞生之前、甚至在宣告IBM大型主机时代开始的IBMsystem/360正式发布(1964年)之前。

(一)相关概念

为方便介绍信息技术的发展历史,这里先介绍几个相关的术语:可伸缩性、集中式管理、分散式管理、封闭信息系统和开放信息系统。

首先,可伸缩性(也称可扩展性)是测量软件系统在线处理能力的一个重要指标,可伸缩性强的系统在应对突发事件时可及时扩展系统以应对更多的资源需求,而在突发事件过后又能及时裁减相应的系统资源用于其他的业务,从而提高了资源的利用率。系统的可伸缩性有两种:纵向扩展(scale-up)和横向扩展(scale-out)。纵向扩展指的是在线给系统的节点动态增加或减少资源,如CPU或内存。纵向扩展性好的系统为其所承载的操作系统和应用模块提供更好的资源共享环境以提供更灵活的服务,如动态扩大或缩减当前运行的Apache守护进程数等。而横向发展指的是给一个系统添加更多的节点,如将1个Web服务器扩展为3个以提高系统的响应效率。

其次,根据信息管理过程中启动的控制过程数量以及它们运行的资源,信息管理技术可以划分为集中式管理技术和分布式管理技术。当使用集中式管理技术的时候,通常管理过程(或过程组)部署在同一台主机上,其中,过程可以是进程或线程,取决于实现的方式。此时,应用运营和分析数据等任务运行于单个系统中,便于接入、汇总和管理相关信息,有利于提高数据安全性与管理便利性。缺点是同一主机负责所有控制信息的处理,容易导致单点失效和可扩展性差等性能问题。大型机系统通常使用这种管理方式。尽管大型机具有稳定高效的特点,但单机系统不可能做到100%的稳定。如2012年12月15日,中国银行采用的IBM大型机在运行过程中突然宕机,时间长达4个小时。无独有偶,2010年新加坡的星辰银行和2011年的美国银行都出现过大型机宕机事件,给相应的金融业务带来严重影响。

当使用分布式管理技术时,大的计算或存储问题被划分为若干个小问题,分散到不同计算资源上并行处理,相应的管理过程有多个,部署在不同的计算资源上,协同完成信息管理任务,最后各运行结果将综合汇总并得到最终结果。此时,业务运营和数据分析等工作由多个计算资源共同承担完成,减轻了单个计算资源的工作负担,并提高了性能。当有某个节点失效时,其上的任务可以迁移到其他正常的节点上继续运行,避免了单点失效的问题。集群技术就是一种典型的分布式计算技术。随着计算机价格的下降和性能的提升,数以百计的低成本普通计算机配置成集群,从而获得更强的计算能力,这往往超过传统单一的以精简指令集为基础的科学计算机。同时,高性能互联技术如Myrinet和InfiniBand的出现,进一步推动了这种计算模式的普及,现已广泛用于高性能计算应用中,如生物计算和抗震分析等。分布式管理技术很好地提高了系统的横向扩展性,但缺点是多过程协作会带来运行期的额外开销。同时,数据分散在多处,会导致多个数据副本的一致性、访问的安全性等管理上的问题。另外,多源数据的抽取、转换和加载(Extract、Transform and Load, ETL)等操作给数据分析带来更多额外的处理开销。

最后,根据服务供给过程中所涉及的软硬件计算资源的获得和运维等服务是由少数几个指定供应商供应还是大规模公众运营,计算架构可以划分为封闭式系统和开放式系统。封闭式系统包含两类,一类是早期的大型机系统,不对外开放,自己独立运行;另一类是底层基础设施使用大型机等封闭系统,上层解决方案由相应厂商提供的分布式系统。封闭式系统是一种垂直整合资源的服务系统,拥护者一般是拥有良好用户合作关系的科技巨头,如甲骨文、惠普等。这些厂商把自己生产的硬件和软件业务有机合成到相应的服务套装中,并对整体环境进行调优,提供相对可靠和安全的服务。但因所有计算设施均来自单一厂商,用户容易被厂商锁定,打包方案价格偏高。而且,不同厂商系统间兼容性不好,限制了应用的拓展。特别是当有客户中途希望改换服务提供商,相应数据迁移工作难度将很大。

可复用可定制的开放体系结构,是互联网应用共享成功的关键支撑技术之一。开放式体系结构指具有以下特点:①底层网络上各节点间互操作性强;②基础软件和支撑软件可从多方获得;③应用系统的可移植性和可剪裁性强。开放架构需要有开放性的计算基础设施、标准、虚拟化技术和面向服务架构(Service-Oriented Architecture, SOA)等技术的支持。首先,计算基础设施的开放性始于1978年Intel发布X86通用计算机,而这也揭开了计算机的开放生态环境新时代。现代开放式服务器包括基于Windows、UNIX、Linux等操作系统的服务器。其次,标准化是实现开放性的基础。国际标准化组织(ISO)早在1978年就开始制定开放系统互联(OSI)标准,为分布式系统提供了开放连接的基础。2010年英特尔帮助创建了一个由70多家全球领先企业联合组成的“开放式数据中心联盟”,开发更加开放、更具互操作性的云计算和数据中心解决方案,为如何部署、维护以及优化云计算基础架构,提供经过验证的云构建方案及实际指导。2014年,华为推出融合云计算解决方案FusionCloud,实现了异构厂家硬件资源池融合,计算、存储、网络架构融合,以及固定移动融合的云接入。通过整合OpenStack开源云平台技术,FusionCloud可以最大限度地实现云平台的开放性,帮助企业和服务供应商建立和管理各项云服务。另外,虚拟化技术能处理操作系统、中间件和应用的映像,主动预先构建并分配到正确的物理机等问题。近年来,虚拟化管理平台如KVM、Xen、VMware等都走向开放平台架构,多个厂家的虚拟机可以在开放的平台架构下并存、协作以提供更丰富的应用。而面向服务架构是一个系统或软件体系结构在进化过程中采用构件化技术和服务供给的使用方式提高资源的可重用性、可扩展性和灵活性。以上这些技术相互支撑使得开放式系统获得比封闭式系统更好的横向扩展能力。同时,用户可以根据自身的需求和喜好选择服务供应商,拥有更自由的解决方案。

(二)螺旋上升过程

正如前面所述,云计算概念本身不是一个突破性的发明,其发展历程可以追溯到大型机时代。随着时间的推移,新的概念、新的能力不断涌现、成长与提升,信息技术的发展是一个螺旋上升的过程。如图1-1所示,信息技术发展历程大致可以划分为以下几个阶段:集中封闭式计算、分布开放式计算以及集中开放式计算。

图1-1 信息技术架构的发展

1.集中封闭式计算

从1960年到1980年是集中封闭式计算,其特征是采用大型主机集中式管理信息系统的所有数据和应用,多个使用者通过终端机(或个人计算机)与系统互动,所有数据处理与存储都在主机上完成。该系统的伸缩性局限在纵向扩展上。同时,大型机上部署的信息系统相应的解决方案也由厂商提供。自1964年IBMsystem/360正式发布并承载大型应用以来,大型机很长一段时间都被看作是企业应用与数据集中处理的平台,曾支撑了美国阿波罗人类第一次登月计划中相关的复杂计算。直至2010年INFORMAiCA年的技术白皮书报告,大型机仍然活跃在银行、保险、航空等大型企业的后台数据中心,承载着相关领域的核心业务。据该报告,全世界70%~80%的这些行业的关键数据依然由大型主机进行管理[5]

大型机蓬勃发展期间有两个值得注意的计算模式:并行计算和效用计算。首先,并行计算是用多个CPU联合求解问题并汇总的计算模式。1966年,Sperry Rand公司的UNIVAC分部发布了第一台多处理器计算机UNIVAC 1108,每台配备了最多3个CPU及2个I/O控制器,其专用的EXEC 8操作系统支持多线程的运行,为并行计算的产生提供了硬件条件。并行计算的产生与发展加速了计算的过程,使得在有限时间内解决复杂问题成为可能,如汽车碰撞试验和天气预报等。

其次,效用计算将计算、存储和服务等计算资源包装为计量服务。其特点是允许用低价位甚至是零首付的方式获得计算初始资源,即通过租用的方式按照实际使用情况付费。效用计算的目标是实现IT资源像传统公共实施(如水和电等)一样供应和收费。在20世纪60~70年代,由于大型机价格昂贵,IBM和同期大型机生产商已经实施了这种计算模式,采用分时机制将计算能力、数据存储能力等提供给全球其他大型企业。伴随价格相对低的小型机和PC的出现和普及,这种商业模式逐渐淡出人们的视野。直至90年代后期,这种模式开始复兴。效用计算所提倡的资源按需供应和用户按使用量付费的理念与云计算相符。

2.分布开放式计算

从1980年到2007年是分布开放式计算技术大量涌现的时期。1971年Kenbak Corporation推出Kenbak-1个人计算机(Personal Computer, PC),标志着第一台可大规模生产的PC产生。PC泛指大小、性能以及价位适合个人使用、相互分离且由用户直接操控的计算机,包括台式机、笔记本、上网本及近年的个人数码助理(Personal Digital Assistant, PDA)、智能手机、可穿戴式电脑等。时至今日,我们看到个人计算机越来越普及和便携,可编程的数字逻辑器件大量嵌入到我们的日常生活中,包括个人计算机、服务器、ATM取款机、自动服务终端、路由器、交换机、MP3播放器、电子游戏机、电视机、DVD/BP/CD播放机、冰箱、洗衣机等。计算设备的多元化及各种网络接入方式的涌现与迅猛发展改变了人们处理信息的方式、使用的情景及交互的范例,实现了人们随时随地方便地接入、获取、处理或交换信息。

个人计算机的发展和20世纪60年代后期产生的阿帕网共同促进分布式应用的形成。70年代后期到80年代早期,分布式计算作为计算机科学的一个独立学科形成。同期,以X86服务器的诞生为标志,微型计算机开始作为服务器,取代了旧的大型主机。企业信息系统从全封闭的软硬件堆栈架构走向网络、存储、服务器、操作系统、中间件、应用层等多层次水平分工的架构,各层之间接口标准化、规范化,极大地简化了每一层的技术复杂度。

分布式计算隐藏了计算机的分散性和异构性,向用户提供统一的编程接口和常见的服务,如数据管理、远程执行、并行处理、资源管理、服务管理、安全和容错等。从分布式概念提出后的近30年,由于网络和计算两大技术的发展,新概念、新技术的提出,侧重面不同,我们见证了多个分布式计算模式的产生与发展,包括C/S计算(Client/Server, C/S)、对等计算(Peer-to-Peer, P2P)、网格计算(Grid Computing)、Web服务(Web Services)、移动计算(Mobile Computing)、普适计算(Pervasive Computing)和透明计算(Transparent Computing)。各计算模式的定义、系统模型及其特点见表1-1。

表1-1 分布式计算模式一览

基于这些计算的应用系统多采用开放架构,普遍具有以下特点:(1)动态性,参与的节点可以动态地加入和离开计算组织,组织在不同的计算环境中的指向不同,如网格中指的是虚拟组织;(2)异构性,参与的节点多是异构资源,有着不同的计算能力、体系结构和数据表达,如移动计算中的智能手机和笔记本计算机就是异构资源,相应的软件可从不同的供应商获得;(3)可移植性和可剪裁性,异构协作的环境需要应用软件具备可移植性,同时,个性化追求也需要应用软件具备给不同的用户、不同的环境提供恰当服务的功能;(4)互操作性,分布式环境内在的分布特性决定多节点系统的互操作是每个参与协作的节点必不可少的能力。促进节点间交互的多种规范和技术在这期间涌现,如Web服务描述语言(Web Services Description Language, WSDL),简单对象访问协议(Simple Object Access Protocol, SOAP),统一描述、发现和集成(Universal Description, Discovery and Integration, UDDI)等。由上可见,这个期间的计算是开放式计算。

3.集中开放式计算

分散式管理模式减少每了个控制过程的工作负载,提高了每个控制过程的内聚度、任务执行的并发度和并行度。避免了单点失效。在20世纪80年代、90年代和21世纪初期,吸引了大量研究者的兴趣,并得到工业界的广泛应用。然而,分散式管理模式发展到一定的阶段,弊端逐步显现。

随着网络和计算规模的扩大和应用的普及,企事业单位的一个关键业务往往需要涉及服务器、网络、存储等各方面的基础设施的协同配合。虽然对软硬件各层的开发已经实现了解,但在部署和运行态仍然是软硬件耦合绑定的关系,容易出现跨业务的资源忙闲不均的现象,导致资源利用率不高。随着企事业单位信息化进程的不断推进,软硬件服务生态链日益繁荣,硬件异构、多厂家分散式管理集成的复杂度越来越高。而业务驱动的基础设施资源的集成管理配置和按需供给往往成为影响企业业务需求的关键制约性因素。阻碍了不同单位甚至同一单位不同部门间的信息服务共享和创新应用的发展。其主要问题总结概括为以下四大方面:

(1)平均资源利用率及能耗效率低下。各企业单位甚至分部门普遍采用独立采购软硬件资源的方式,且所有应用软件、数据库以及中间件均采用独占计算。存储和网络资源的烟囱式部署,即业务应用系统独占服务器、存储、OS、数据库等资源,造成软件应用与硬件资源的静态捆绑等现象,进而造成不同应用之间无法动态、高效共享相同的计算与存储资源,导致企业IT的平均资源利用率始终低于20%。科研界虽然鼓励集成空闲CPU资源,如网格计算,但恰好是共享资源的特性缺乏商业运作,导致各单位或个人共享资源的动力不足。根据2010年卡内基梅隆大学对M45超级计算集群连续跟踪10个月后的发现,所有集群节点的CPU利用率都为5%~10%。

(2)新业务上线测试周期长,效率低下。企业任何一项新的业务上线,从最基础的硬件平台开始,向上逐层部署各层软件,包括操作系统、中间件、数据库到业务软件,均需要投入专业的信息技术团队进行安装、调试、验证等,平均耗时2~3个月。

(3)资源储备及弹性伸缩能力不足,不具备应对企业突发业务高峰期处理的能力。计算资源分散管理,容易造成企业内部物理基础设施独立管理,横向扩展性差。针对特定的垂直行业,短时间内突发性的高流量、高密度业务(如国庆黄金周期间,大量照片视频上传),企业内部物理基础设施资源无法满足突发业务的需求。

(4)共享性弱,服务对象范围小。截至2013年10月,中国6000多所中小学以及近70%的高校建设了校园网。其中,67所普通高校开展了现代远程教育,140多种专业,160多万名学生注册了网络教育。然而,我们可以发现诸多著名高校的国家级精品网络课程,存在大量受限制的链接和不能显示的页面,这些资源往往只有本校学生可用,无法让广大适龄学生享用这些非常有用的资源。

运算规模日益扩大与计算的普及,信息技术与通信技术的融合,催生了信息通信技术(ICT),允许人们随时随地通过各种设备接入互联网,使用或享受海量数据和丰富无比的服务,推动了IT架构的升级。最近的10年,在ICT、虚拟化、资源管理、标准化等技术的推动下,IT计算架构从本地计算模式、客户端与服务器端并重的传统分布式计算模式,向以“泛在网络接入”“计算、存储的集中资源池化”“快捷的弹性伸缩”等为典型特征的集中开放式架构演进。集中开放式架构,顾名思义,就是以“集中式控制、分布式计算、开放架构”为特点的计算模式。区别于前面的分布开放式计算,我们看到了从网络、服务器等硬件基础设施的管理到应用服务的集中式管理的全面回归。

首先,在网络层,2009年一种创新网络架构,即软件定义网络(Software Defined Network, SDN),诞生于美国斯坦福大学,其核心思想是路由功能分离,将网络设备的控制面与转发面分隔。同时,采用独立的、逻辑上集中的平台控制路由。区别于传统网络,SDN有两个需要注意的特点:(1)SDN的集中控制器拥有所有网络路径和设备的能力信息,涵盖了整个网络端到端的视图,可直接编程实现硬连线的路由。当故障出现的时候,集中控制器将按照预先计算出的可替代路由来取代故障路由,满足服务高可用性需求。(2)SDN集中式控制器是逻辑上的集中式控制管理,而不是单一过程管理。其物理部署上采用分布式计算的实施方案。由于SDN结合了集中式管理和分布式计算的双重优点,有着各种预期的经营效益和创新业务的可能,因此,它从诞生起就吸引了大量的学术界和工业界的兴趣,如美国斯坦福大学、清华大学和华为技术有限公司华为技术有限公司被全球运营商列为最佳SDN/NFV解决方案供应商(2014),http://www.csdn.net/article/a/2014-02-24/15818022。

其次,在系统软件层,促进服务器应用整合的系统软件有基于X86架构的虚拟化软件,如Xen,VMware等。在中间件层,全球最著名的搜索引擎谷歌一直是集中式控制的拥护者,其著名产品包括“仙女座”(Andromeda)虚拟网络、大型分布式存储系统GFS,BigTable等都使用集中式控制,而这些中间件系统的高效性和稳定性都有力地证明了集中式控制的有效性。促进集中式管理的中间件还有华为融合操作系统Fusion Sphere、集中式资源监控、基于虚拟磁盘的异构服务平台透明计算(TransCom)、提供Web方式的远程集中虚拟桌面管理的华为融合接入系统FusionAccess等。

最后,在应用层,Amazon's EC2,Twitter和Facebook的推送服务等都是采用集中式管理。这个时期的计算平台逐渐演变成以运营商为中心的信息聚合、驻留、处理与交换平台,大规模的公众运营,有利于形成以运营商为中心的产业链聚合平台。

1.1.2 商业模式的转变

商业模式(又称经营模式、商务模式、生意模式)的定义最早在20世纪50年代提出,70年代首次出现在《计算机科学》杂志上,直到90年代才开始被广泛使用和传播。根据罗素·托马斯(Ruse.Thomas)2001年的定义,商业模式是开办一项有利可图的业务所涉及的流程、客户、供应商、渠道、资源和能力的总体构造。换句话说,商业模式是以商品所有者为中心,把商品、消费者、信息、流通等元素按照一定的组织形式连接在一起所形成的实现商品价值转移的结构体系。

商业模式通常包含以下三要素:客户价值主张(Customer Value Proposition)、盈利模式(Profit Formula)、关键资源和流程(Key Resources and Processes)。客户价值主张是企业通过其产品或服务能为客户带来的其他企业无法提供的价值。盈利模式描述的是供应商如何从为客户创造价值的过程中获得利润。关键资源和流程指的是供应商通过资源整合(包括人才、技术、产品、工具、设备和品牌等),使各资源高效协作地运行,形成核心竞争力,为客户提供价值。其中,客户价值主张和盈利模式分别明确客户和公司的价值,而关键资源和流程则描述如何有效地实现这些价值。一个成功的商业模式往往有以下八个特点:整合、高效率、系统、核心竞争力、实现形式、客户价值最大化、持续盈利和整体解决。其中,整合、高效率、系统是先决条件,核心竞争力是手段,客户价值最大化是企业追求的目标,而持续盈利是检验一个商业模式是否成功的唯一外在标准。

一、典型的商业模式

在信息技术领域,创新在人们脑海中呈现的往往是技术的创新(如新的算法、新的机制等)和产品的创新(如苹果推出的iPhone)。实际上还有一类创新,那就是商业模式的创新。大多数技术或产品类的创新对行业或人们的生活生产带来持续渐进型的影响或改变,而商业模式的创新往往可以改变整个行业的格局,重塑产业,带来惊人的价值增长,甚至让市场重新洗牌。商业模式的发展历史上经历了几种典型的模式:店铺模式、搭售模式、网模式、资源衍生模式、金字塔模式和平台式。首先,店铺模式是最古老也是最基本的商业模式。其中,店铺即商店,其表现形式为在具有潜在消费者群的地方开设店铺、展示其产品或服务并实施销售活动。店铺有实体店和网店两种。实体店如百货商店,其历史可以追溯到唐朝。由于实体店铺需要规划人事和店面装潢,成本较高。同时,其买卖地点固定,造成买卖效率低、对市场反应速度慢、市场覆盖面有局限等。而网店概念是IBM公司于1996年提出,其表现形式为互联网上开的店铺,能够让人们在浏览网站的同时进行实际购买,并且通过各种支付手段进行支付,完成交易全过程。网店是电子商务的一种形式,与实体店相比,网店具有价格低廉、交易便捷、形式多样等特点,迅速得到商家和客户的喜爱和推广。从2000年到2009年,电子商务已经进入可持续性发展的稳定期。而近年来3G的蓬勃发展促使全网全程的电子商务时代成型。

搭售模式也称饵与钩模式(Bait and Hook Model)、剃刀与刀片模式(Razor and Blades Model),或产品的开门模式。其表现形式是基本产品的出售价格极低甚至免费赠送,而与之相关的消耗品或是服务的价格则相对昂贵。其典型特点包括以下两点:(1)产品的销售和服务行为背后隐含相关企业的下一次盈利机会;(2)企业由客户的一次性消费进入客户的重复性消费领域。典型应用如手机(基本产品或饵)和通话时间(通信服务或钩)。当移动公司把手机送给你的时候,你也会被要求与其签订指定时间的通信服务使用合约。也就是说,你和它的生意关系才刚刚开始,而不是结束。另一种应用如惠普的打印机和墨盒。惠普的打印机往往以比较便宜的价格出售,然而与之匹配的墨盒往往比较贵,甚至比打印机还贵。因此,当客户消费了几个墨盒之后,打印机的成本就已经赚回来。

网模式中的“网”不是通信网络,而是由相应企业的销售渠道组织构建而成的密集完整的网络,其中,每一个销售点都将成为这个网的一个节点。该网络节点越密集、覆盖面越大、占有市场份额越大、整合市场中尽可能多的资源,则相应的产品对人民生活方方面面的渗透度越大,对市场的控制度就越大,产生的利润也就越大。例如,可口可乐的销售渠道有22种,包括大型超市、零售店、自动售货机等。其设计与部署的理念是目标用户可能会产生喝水愿望的地方都将摆上可口可乐,让消费者触手可及。同理,大家所熟知的7-Eleven便利店也是网模式的另一个典型应用例子。

资源衍生模式是从现有资源挖掘衍生价值,不断构建新的盈利点和盈利模式,使利润以倍数增长。该模式有两大特点:(1)重复使用优质资源;(2)衍生产品/项目必须和现有资源有密切的联系。典型应用如加油站附带快餐店和便利店,满足司机旅客朋友的需要。又如大家熟知的餐馆里的一鱼多吃等。

金字塔模式是根据客户的不同特点,对客户群进行细分,对不同客户群提供不同类型的产品。在满足用户个性化需求的同时尽可能地覆盖市场。客户群的划分标准有很多,如护肤品根据使用的部位可以分为护手霜、眼霜、面霜等。而面霜根据肤质又可进一步细分为油性、混合性和干性,满足用户个性化需要。

平台式是通过搭建一个合理化的平台,吸引相关人群来经营发展,保证稳定的业务增长和持续发展的动力。该种模式有两大特点:(1)构建基础,其他企业可以在此基础上推出他们的产品或服务,平台提供商借此实现外行赚内行的钱;(2)产业链的控制、整合和创新,平台提供商与创新企业之间有着密切的合作动力。该模式的典型应用有大家熟知的百度、谷歌等。百度公司通过搜索引擎将浏览者引到百度并到达其后的大量网站,帮助广告业主获得回报,将流量、点击量和数据量等变成利润。

二、商业模式的融合与变迁

近10年,随着信息通信技术的融合与发展,网络的价值在数据中心的重要性得到提升,电信运营商和大型的Internet服务商成为数据中心的建设主体,客户集中度加强,为电信厂家(如华为、Cisco等)进入这个领域提供了机遇。同时通过互联网提供软件、硬件与服务,实现通过网络浏览器或轻量级终端软件来获取和使用服务,即服务逐渐从局域网向Internet迁移,终端计算和存储向数据中心迁移。像电厂集中供电的模式一样,计算能力逐渐作为一种商品进行流通,像用电一样,取用方便,费用低廉,按使用付费。于是我们见证着各种商业模式以结合互联网技术的新形式出现,如业务交付平台模式、自助服务模式以及软件即服务(Software as a Service, SaaS)模式。业务融合的需求及快速变化的市场环境对电信网络业务层的功能、架构、开放性等提出了新的要求。以公共、水平的业务架构代替大量垂直的“烟囱式”业务架构的趋势成为必然,业务交付平台模式应运而生。华为数字商城平台就是一个业务交付平台的例子,为客户提供基于网络的丰富的音乐、视频、游戏和应用等业务。而这些业务都会用到公共支撑服务、互联网业务以及电信业务。端到端的商业解决方案支持电信、多媒体和互联网业务部署和运营,实现在移动宽带和跨行业应用等领域新的价值增长,有效降低业务上线成本,缩短业务上市时间等。业务交互平台支持多个供应商与多个客户之间的交易。当这些交易发生时,双方往往都承担很高的交易成本,这就导致互联网中介商业模式的产生。除华为数字商城平台之外,苹果、腾讯、百度、阿里巴巴等所采用的商业模式都是中介模式、网站模式和平台模式的融合与发展。

自助模式是备受关注的苹果公司创新商业模式之一。苹果公司首先推出如iPod、iPhone等硬件产品,然后推出虚拟超市iTunes商店,提供音乐、电影、podcast、应用等数字商品,供用户通过浏览器自助获取服务。这些数字产品吸引了大量的用户,在提高iPhone知名度和销售的同时,又引得大量的应用程序开发人员开发基于iPhone的新应用程序,不断地丰富苹果应用程序库App Store。而这反过来进一步提高了iPod和iPhone的用户体验。

SaaS模式是一种创新型的软件基于Web的交付模式,将某些特定应用软件功能封装成服务并通过Internet提供。在这种模式下,用户无需购买软件,而是根据自己的实际需求,向软件提供商租用基于Web的软件来获得相应的功能。有研究表明企业70%~80%的IT预算花费在基础设施的运维上。而在SaaS模式中,频繁的属性更新操作由服务提供商全权管理与负责,并应用于所有租户或组织。该管理模式减免了用户的前期投资和持续的基础设施运维费用,很快得到用户和供应商的接受,尤其是许多小型企业。同时,SaaS供应商除了向客户提供互联网应用之外,也提供软件的离线操作和本地数据存储,让用户随时随地都可以使用其定购的软件和服务。与公用计算不同,它不是按消耗的资源收费,而是根据用户使用的应用程序的价值收费。

这些涌现的商业模式推动云计算商业模式的形成。云计算的发展是商业模式转变和用户消费模式变化的结果。商业模式的转变主要是从“购买软硬件产品”向“购买信息服务”转变,相应的消费模式则转变为服务提供商通过互联网提供软硬件与服务,而用户通过浏览器或轻量级终端获取和使用服务。在20世纪80年代网格计算,90年代公用计算,21世纪初虚拟化技术、SOA、SaaS应用的支撑下,云计算作为一种新兴的资源使用和交付模式逐渐为学术界和产业界所认知。云计算先行者的云服务已开始运营,越来越多的用户接受并使用云计算服务。

1.1.3 需求的驱动

云计算不但是技术进步和商业模式变迁的产物,同时也是需求驱动的产物。云计算的需求来自三大方面:商业需求、运营需求以及计算需求。

从商业角度来看,随着信息通信技术的普及,大型企业和事业单位如互联网企业、电信、银行、公安等信息系统的数据量越来越多。例如,Google公司通过大规模集群和MapReduce软件每个月处理的数据量超过400PB。2013年的统计数据显示,每个月有8亿人次使用Youtube观看视频。深圳市装有20多万交通摄像头,每天新产生的数据量大于1PB。这些数据种类多,更新频率快,数据量巨大,所带来的软硬件投资以百万甚至千万计算,包括机房、服务器、电源、软件、数据、管理人员等。这些企事业单位承受着高成本的压力,期望降低IT成本、简化IT管理、快速响应市场、提高投资回报率并实现长足的发展。为此,企业希望融合现有基础设施并延伸其价值,合理利用资源,提升管理人员的生产力。同时发现更多衍生价值,加速体现业务价值等。

目前大多数企业采用传统IT运维模式,其特点如下:(1)烟囱式系统部署,数据直接从各个数据源直接抓取到发起数据请求的业务主管部门,业务独享资源,利用率低:5%~10%的CPU利用率、小于36%的存储设备使用率、小于50%的网络利用率等。(2)硬件系统可靠性低,成本高,如每GB数据的计算存储成本是5美元,PC更换成本高,平均每3年左右更换一次等。(3)运维效率低,维护成本高。首先,目前数据中心多采用普通服务器,有着常态的故障事件,据Google在2008年的统计数据,在一个拥有1000台机器的集群中,平均每天坏掉1台。除了硬件维修,运维工作还包括软件补丁、升级、安装等,复杂繁多,致使大型数据中心人均维护服务器数量小于100台。而腾讯、Google等大型数据中心的服务器总数都在106以上,需要大量的维护人员。人力维护费用占运营成本的1.2%。而且,一般来说,前期硬件准备需要约6个月的时间,业务上线需要7~18个月的时间等,给企业带来非常大的成本。(4)能源消耗大,利用率低。有数据显示,2009年我国数据中心总耗电量约为364亿kWh,约占当年全国电力消耗总量的1%。照此能效水平及数据中心服务器发展增速,2015年我国数据中心总能耗将达到1000亿kWh左右,相当于三峡电站一年的发电量,2020年将超过2500亿kWh,或将超过当前全球数据中心的能耗总量。然而,相应的能源利用率却非常低。电源使用率(Power Usage Effectiveness, PUE)是数据中心总设备能耗与IT设备能耗之比。PUE是国际上比较通用的数据中心电力使用效率的衡量指标,越接近1表明能效水平越好。国外先进的数据中心机房PUE值通常小于2,而我国的大多数数据中心的PUE值在2~3。

因此,目前企业ICT运维期望规范流程、降低成本、节约能源,利用融合基础设施实现自动化供应基础设施,图1-2描绘了数据中心融合基础设施的系统模型,包括虚拟化和池化的服务器、存储设备、网络和I/O资源。通过汇集和共享资源实现快速地重新分配资源,以便更好地满足不同应用程序的不断变化的性能、吞吐量和容量需求。换句话说,我们期望融合的基础设施具有以下特征:富弹性、虚拟化、可协调处理以及模块化。

图1-2 数据中心基础设施的融合王曼荻,惠普云计算、云存储解决方案,中国惠普有限公司。

最后,用户期望随时随地都可以获得期望的计算。工信部统计数据显示,截至2012年1月底,全国移动电话用户数已达到9.97亿户。2011年11月中国互联网信息数据过滤中心发布的数据显示,中国网民为5.05亿。这些用户通常有以下特点:(1)用户经常要移动,因为他们常有着多种多样的日程安排,包括项目、工作、会议、医院、旅行、运动、休假、购物等。(2)用户每天要处理大量的文档,包括电子邮件、代码、演示文稿、报告、电子书籍、电影、病例等。用户期望更方便的网络接入方式,可以用任何随行计算设备,如手提电脑、PC或手机等,在任何地方访问或与其他人共享数据和进行计算。

1.1.4 小结

综上所述,云计算并不是一个全新的概念,它是并行分布式计算技术理念和按需(On-Demand)商业模式的统一。技术的发展、商业模式的转变以及需求的驱动是云计算产生和迅猛发展的三大基石。

首先,随着通信与信息技术的融合与发展,尤其是移动终端的智能化、移动宽带网络的普及,越来越多的移动设备进入互联网,网站和互联网业务系统需要处理的业务量和数据量快速增长,承受着与日俱增的负载,面临在用户数量快速增长的情况下如何快速扩展原有系统的挑战。同时,随着数据中心规模的扩大,其电力成本、空间成本、各种基础设施的维护成本快速上升,导致数据中心面临着如何有效地利用资源承载更多业务的挑战。另外,随着高速网络连接的衍生、高性能芯片、磁盘驱动器和存储产品功能的增强、软件设计与相关技术的日益成熟和应用的普及,数据中心具备为大量用户快速处理大规模复杂计算和数据处理任务的能力。随着服务器整合需求的不断升温,对计算能力、资源利用效率、资源集中化的迫切需求,推动着IT架构的升级,为云计算的诞生提供了关键的技术支持;而云计算标准的快速发展进一步推动云计算应用的快速部署、协作与推广。其次,商业运作模式随着技术的发展不断演变,从最早的店铺模式到以互联网为关键支撑技术的电子商务,目前互联网时代信息技术的主流商业模式正经历着从“购买软硬件产品”向“购买信息服务”的转变。最后,数据中心尤其是西方国家的数据中心的硬件成本仅占20%,管理成本却高达80%,这给企事业单位尤其是中小企业带来高成本的压力,驱动人们探求运营成本更低的IT使用和管理技术。

2006年Google CEO Eric Schmidt在搜索引擎大会上首次提出“云计算”的概念,同年Amazon陆续推出云计算服务,成为少数几个提供99.95%正常运行时间保证的云计算供应商之一。2007年云计算概念开始获得全球公众和媒体的广泛关注,已成为IT的发展趋势。