【云计算】概念是由Google提出的,这是一个美丽的网络应用模式。狭义云计算是指IT基础设施的交付和使用模式,指通过网络以按需、易扩展的方式获得所需的资源;广义云计算是指服务的交付和使用模式,指通过网络以按需、易扩展的方式获得所需的服务。这种服务可以是IT和软件、互联网相关的,也可以是任意其他的服务,它具有超大规模、虚拟化、可靠安全等独特功效;“云计算”图书版本也很多,都从理论和实践上介绍了云计算的特性与功用。
基本概念
简要介绍
英译:cloud computing。
云计算(Cloud Computing)是网格计算(Grid Computing)、分布式计算(Distributed
Computing)、并行计算(Parallel Computing)、效用计算(Utility Computing)网络存储(Network
Storage Technologies)、虚拟化(Virtualization)、负载均衡(Load
Balance)等传统计算机技术和网络技术发展融合的产物。它旨在通过网络把多个成本相对较低的计算实体整合成一个具有强大计算能力的完美系统,并借助SaaS、PaaS、IaaS、MSP等先进的商业模式把这强大的计算能力分布到终端用户手中。Cloud
Computing的一个核心理念就是通过不断提高“云”的处理能力,进而减少用户终端的处理负担,最终使用户终端简化成一个单纯的输入输出设备,并能按需享受“云”的强大计算处理能力!
最简单的云计算技术在网络服务中已经随处可见,例如搜索引擎、网络信箱等,使用者只要输入简单指令即能得到大量信息。
未来如手机、GPS等行动装置都可以透过云计算技术,发展出更多的应用服务。
进一步的云计算不仅只做资料搜寻、分析的功能,未来如分析DNA结构、基因图谱定序、解析癌症细胞等,都可以透过这项技术轻易达成[1]。
稍早之前的大规模分布式计算技术即为“云计算”的概念起源
云计算时代,可以抛弃U盘等移动设备,只需要进入Google Docs页面,新建文档,编辑内容,然后,直接将文档的URL分享给你的朋友或者上司,他可以直接打开浏览器访问URL。我们再也不用担心因PC硬盘的损坏而发生资料丢失事件。
1.狭义云计算
提供资源的网络被称为“云”。“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取,按需使用,随时扩展,按使用付费。这种特性经常被称为像水电一样使用IT基础设施。
1.广义云计算
这种服务可以是IT和软件、互联网相关的,也可以是任意其他的服务。
解释:
这种资源池称为“云”。“云”是一些可以自我维护和管理的虚拟计算资源,通常为一些大型服务器集群,包括计算服务器、存储服务器、宽带资源等等。云计算将所有的计算资源集中起来,并由软件实现自动管理,无需人为参与。这使得应用提供者无需为繁琐的细节而烦恼,能够更加专注于自己的业务,有利于创新和降低成本。
有人打了个比方:这就好比是从古老的单台发电机模式转向了电厂集中供电的模式。它意味着计算能力也可以作为一种商品进行流通,就像煤气、水电一样,取用方便,费用低廉。最大的不同在于,它是通过互联网进行传输的。
云计算是并行计算(Parallel Computing)、分布式计算(Distributed Computing)和网格计算(Grid
Computing)的发展,或者说是这些计算机科学概念的商业实现。云计算是虚拟化(Virtualization)、效用计算(Utility
Computing)、IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(软件即服务)等概念混合演进并跃升的结果。
总的来说,云计算可以算作是网格计算的一个商业演化版。我国刘鹏教授早在2002年,就针对传统网格计算思路存在不实用问题,提出计算池的概念:“把分散在各地的高性能计算机用高速网络连接起来,用专门设计的中间件软件有机地粘合在一起,以Web界面接受各地科学工作者提出的计算请求,并将之分配到合适的结点上运行。计算池能大大提高资源的服务质量和利用率,同时避免跨结点划分应用程序所带来的低效性和复杂性,能够在目前条件下达到实用化要求。”这个理念与当前的云计算非常接近。刘鹏教授当时通过在清华大学、北京大学、中科院计算所等单位的一系列精彩演讲,推动计算池思想的普及,受到广泛关注和接受。
云计算的特点
(1) 超大规模
“云[2]”具有相当的规模,Google云计算已经拥有100多万台服务器, Amazon、IBM、微软、Yahoo等的“云”均拥有几十万台服务器。企业私有云一般拥有数百上千台服务器。“云”能赋予用户前所未有的计算能力。
云计算管理系统
(2) 虚拟化
云计算支持用户在任意位置、使用各种终端获取应用服务。所请求的资源来自“云”,而不是固定的有形的实体。应用在“云”中某处运行,但实际上用户无需了解、也不用担心应用运行的具体位置。只需要一台笔记本或者一个手机,就可以通过网络服务来实现我们需要的一切,甚至包括超级计算这样的任务。
(3) 高可靠性
“云”使用了数据多副本容错、计算节点同构可互换等措施来保障服务的高可靠性,使用云计算比使用本地计算机可靠。
(4) 通用性
云计算不针对特定的应用,在“云”的支撑下可以构造出千变万化的应用,同一个“云”可以同时支撑不同的应用运行。
(5) 高可扩展性
“云”的规模可以动态伸缩,满足应用和用户规模增长的需要。
(6) 按需服务
“云”是一个庞大的资源池,你按需购买;云可以像自来水,电,煤气那样计费。
(7) 极其廉价
由于“云”的特殊容错措施可以采用极其廉价的节点来构成云,“云”的自动化集中式管理使大量企业无需负担日益高昂的数据中心管理成本,“云”的通用性使资源的利用率较之传统系统大幅提升,因此用户可以充分享受“云”的低成本优势,经常只要花费几百美元、几天时间就能完成以前需要数万美元、数月时间才能完成的任务。
云计算可以彻底改变人们未来的生活,但同时也要重视环境问题,这样才能真正为人类进步做贡献,而不是简单的技术提升。
(8) 潜在的危险性
云计算服务除了提供计算服务外,还必然提供了存储服务。但是云计算服务当前垄断在私人机构(企业)手中,而他们仅仅能够提供商业信用。对于政府机构、商业机构(特别象银行这样持有敏感数据的商业机构)对于选择云计算服务应保持足够的警惕。一旦商业用户大规模使用私人机构提供的云计算服务,无论其技术优势有多强,都不可避免地让这些私人机构以“数据(信息)”的重要性挟制整个社会。对于信息社会而言,“信息”是至关重要的。另一方面,云计算中的数据对于数据所有者以外的其他用户云计算用户是保密的,但是对于提供云计算的商业机构而言确实毫无秘密可言。这就象常人不能监听别人的电话,但是在电讯公司内部,他们可以随时监听任何电话。所有这些潜在的危险,是商业机构和政府机构选择云计算服务、特别是国外机构提供的云计算服务时,不得不考虑的一个重要的前提。
判断是不是云计算的三条标准
什么是云计算
到底什么是云计算?这是大家比较关注的一个问题。现在我们发现了有很多种不同的说法,到底什么是云,什么不是云,让人很费解。有人讲公有云是云,私有云不是云;还有人说支持虚拟化叫云,不支持虚拟化不叫云,但是Google不支持虚拟化,而我们都认为Google是云;还有人讲有1000台服务器是云,好像999台就不是云。现在有个别高性能计算中心,什么都没变,就是名字改成叫云计算中心啦。为什么有那么多人要打着云计算的旗号呢?要么赚眼球,要么圈钱,各有各的目的。
作为公众,需要鉴别哪些是真云,哪些是假云。为此,刘鹏教授提出判断是不是云计算的三条参考标准,供大家参考[3]:
用户所需的资源不在客户端而来自网络
这是云计算的根本理念所在,即通过网络提供用户所需的计算力、存储空间、软件功能和信息服务等。
服务能力具有分钟级或秒级的伸缩能力
如果资源节点服务能力不够,但是网络流量上来,这时候需要平台在一分钟几分钟之内,自动地动态增加服务节点的数量,从100个节点扩展到150个节点。能够称之为云计算,就需要足够的资源来应对网络的尖峰流量,哪怕是突然出现了“贾君鹏”这样的热点。过了一阵子,流量下来了,服务节点的数量在随着流量的减少而减少。现在有的传统IDC自称也能提供伸缩能力,但需要多个小时之后才能提供给用户。问题是网络流量是不可预期的,不可能等那么久。
具有较之传统模式5倍以上的性能价格比优势
看了上面一条,有些人在想,没关系,多配一些机器,流量再大也应付得了。但这不是云计算的理念。我们还有个性能价格比指标。云计算之所以是一种划时代的技术,就是因为它将数量庞大的廉价计算机放进资源池中,用软件容错来降低硬件成本,通过将云计算设施部署在寒冷和电力资源丰富的地区来节省电力成本,通过规模化的共享使用来提高资源利用率。国外代表性云计算平台提供商达到了惊人的10-40倍的性能价格比提升。国内由于技术、规模和统一电价等问题,暂时难以达到同等的性能价格比,我们暂时将这个指标定为5倍。拥有256个节点的中国移动研究院的云计算平台已经达到了5到7倍的性能价格比提升,其性能价格比随着规模和利用率的提升还有提升空间。
例子
这三条标准相当于三张滤网,可以一层层地滤掉那些不属于云计算范畴的东西。让我们来试试灵不灵——来看看下面这些是不是云计算:
PC系统:第一关过不了,因用户所需的资源都在客户端,所以不属于云计算范畴;
iPhone应用软件:如果下载到iPhone上就能独立运行,与外界只是通信关系,则过不了第一关;如果是依托于网络平台运行,计算和数据资源来自网络,iPhone端只是个访问界面,则有可能进入云计算范畴;
Web网站:过得了第一关。但如果还过得了可伸缩性这一关,会很难过性能价格比这一关;
上网本:能过第一关,但它本身只是个终端,如果只是用于上网,则在传统范畴,如果用于与云计算设施交互,只可划入云计算范畴。
广告联盟:难过第二关。将不同网站的广告组织在一起,就构成了广告联盟。发布一个广告,可以出现在众多的网站上。不过,由于公众对广告的点击率不高,广告联盟不需要有大多的可伸缩性,也不容易做到——因为参与者都是众多的小网站;
超级计算中心:如果规模够大,勉强能过第二关,但性价比不好,过不了第三关。超级计算机都是很昂贵的,在性价比上没有优势。我们认为不是云;
在线Office:规模化运作后容易达到云计算的要求。例如,今天大家看到的百汇Office,还有Google的DOCS也是。
在线CRM:规模化运作后容易达到云计算的要求。提供给用户一个月使用成本是几十块钱,这个远远优于我们使用传统模式,是云;
IaaS:像亚马逊租用机器的服务,所以这种性价比也非常好,租用一个虚拟机1小时只要0.1美元,也是云。
Paas:如微软的Azure,可免费提供25GB的存储空间,必定有非常好的性价比,也是云。
云安全:规模化运作后容易达到云计算的要求。比如360安全卫士,提供给用户完全免费的服务,之所以能够这样,是因为有很高的性价比。
云计算的几大形式
来源
InfoWorld网站同数十家公司、分析家和IT用户讨论出了云计算的几大形式:
1.SAAS(软件即服务)
这种类型的云计算通过浏览器把程序传给成千上万的用户。在用户眼中看来,这样会省去在服务器和软件授权上的开支;从供应商角度来看,这样只需要维持一个程序就够了,这样能够减少成本。Salesforce.com是迄今为止这类服务最为出名的公司。SAAS在人力资源管理程序和ERP中比较常用。
Google Apps和Zoho Office也是类似的服务
2.实用计算(Utility Computing)
这个主意很早就有了,但是直到最近才在Amazon.com、Sun、IBM和其它提供存储服务和虚拟服务器的公司中新生。这种云计算是为IT行业创造虚拟的数据中心使得其能够把内存、I/O设备、存储和计算能力集中起来成为一个虚拟的资源池来为整个网络提供服务。
3.网络服务
同SAAS关系密切,网络服务提供者们能够提供API让开发者能够开发更多基于互联网的应用,而不是提供单机程序。
4.平台即服务
另一种SAAS,这种形式的云计算把开发环境作为一种服务来提供。你可以使用中间商的设备来开发自己的程序并通过互联网和其服务器传到用户手中。
5.MSP(管理服务提供商)
最古老的云计算运用之一。这种应用更多的是面向IT行业而不是终端用户,常用于邮件病毒扫描、程序监控等等。
6.商业服务平台
SAAS和MSP的混合应用,该类云计算为用户和提供商之间的互动提供了一个平台。比如用户个人开支管理系统,能够根据用户的设置来管理其开支并协调其订购的各种服务。
7.互联网整合
将互联网上提供类似服务的公司整合起来,以便用户能够更方便的比较和选择自己的服务供应商。
云计算四个显著特点
1.数据安全可靠
首先,云计算提供了最可靠、最安全的数据存储中心,用户不用再担心数据丢失、病毒入侵等麻烦。
很多人觉得数据只有保存在自己看得见、摸得着的电脑里才最安全,其实不然。你的电脑可能会因为自己不小心而被损坏,或者被病毒攻击,导致硬盘上的数据无法恢复,而有机会接触你的电脑的不法之徒则可能利用各种机会窃取你的数据。此前轰动一时的“艳照门”事件据报道不也是因为电脑送修而造成个人数据外泄的吗?
反之,当你的文档保存在类似 Google Docs 的网络服务上,当你把自己的照片上传到类似 Google
Picasa Web 的网络相册里,你就再也不用担心数据的丢失或损坏。因为在“云”的另一端,有全世界最专业的团队来帮你管理信息,有全世界最先进的数据中心来帮你保存数据。同时,严格的权限管理策略可以帮助你放心地与你指定的人共享数据。这样,你不用花钱就可以享受到最好、最安全的服务,甚至比在银行里存钱还方便。
2.客户端需求低
其次,云计算对用户端的设备要求最低,使用起来也最方便。
大家都有过维护个人电脑上种类繁多的应用软件的经历。为了使用某个最新的操作系统,或使用某个软件的最新版本,我们必须不断升级自己的电脑硬件。为了打开朋友发来的某种格式的文档,我们不得不疯狂寻找并下载某个应用软件。
为了防止在下载时引入病毒,我们不得不反复安装杀毒和防火墙软件。所有这些麻烦事加在一起,对于一个刚刚接触计算机,刚刚接触网络的新手来说不啻一场噩梦!如果你再也无法忍受这样的电脑使用体验,云计算也许是你的最好选择。你只要有一台可以上网的电脑,有一个你喜欢的浏览器,你要做的就是在浏览器中键入
URL ,然后尽情享受云计算带给你的无限乐趣。
你可以在浏览器中直接编辑存储在“云”的另一端的文档,你可以随时与朋友分享信息,再也不用担心你的软件是否是最新版本,再也不用为软件或文档染上病毒而发愁。因为在“云”的另一端,有专业的
IT 人员帮你维护硬件,帮你安装和升级软件,帮你防范病毒和各类网络攻击,帮你做你以前在个人电脑上所做的一切。
3.轻松共享数据
此外,云计算可以轻松实现不同设备间的数据与应用共享。
大家不妨回想一下,你自己的联系人信息是如何保存的。一个最常见的情形是,你的手机里存储了几百个联系人的电话号码,你的个人电脑或笔记本电脑里则存储了几百个电子邮件地址。为了方便在出差时发邮件,你不得不在个人电脑和笔记本电脑之间定期同步联系人信息。买了新的手机后,你不得不在旧手机和新手机之间同步电话号码。
对了,还有你的 PDA 以及你办公室里的电脑。考虑到不同设备的数据同步方法种类繁多,操作复杂,要在这许多不同的设备之间保存和维护最新的一份联系人信息,你必须为此付出难以计数的时间和精力。这时,你需要用云计算来让一切都变得更简单。在云计算的网络应用模式中,数据只有一份,保存在“云”的另一端,你的所有电子设备只需要连接互联网,就可以同时访问和使用同一份数据。
仍然以联系人信息的管理为例,当你使用网络服务来管理所有联系人的信息后,你可以在任何地方用任何一台电脑找到某个朋友的电子邮件地址,可以在任何一部手机上直接拨通朋友的电话号码,也可以把某个联系人的电子名片快速分享给好几个朋友。当然,这一切都是在严格的安全管理机制下进行的,只有对数据拥有访问权限的人,才可以使用或与他人分享这份数据。
4.可能无限多
最后,云计算为我们使用网络提供了几乎无限多的可能
为存储和管理数据提供了几乎无限多的空间,也为我们完成各类应用提供了几乎无限强大的计算能力。想像一下,当你驾车出游的时候,只要用手机连入网络,就可以直接看到自己所在地区的卫星地图和实时的交通状况,可以快速查询自己预设的行车路线,可以请网络上的好友推荐附近最好的景区和餐馆,可以快速预订目的地的宾馆,还可以把自己刚刚拍摄的照片或视频剪辑分享给远方的亲友……
离开了云计算,单单使用个人电脑或手机上的客户端应用,我们是无法享受这些便捷的。个人电脑或其他电子设备不可能提供无限量的存储空间和计算能力,但在“云”的另一端,由数千台、数万台甚至更多服务器组成的庞大的集群却可以轻易地做到这一点。个人和单个设备的能力是有限的,但云计算的潜力却几乎是无限的。当你把最常用的数据和最重要的功能都放在“云”上时,我们相信,你对电脑、应用软件乃至网络的认识会有翻天覆地的变化,你的生活也会因此而改变。
互联网的精神实质是自由、平等和分享。作为一种最能体现互联网精神的计算模型,云计算必将在不远的将来展示出强大的生命力,并将从多个方面改变我们的工作和生活。无论是普通网络用户,还是企业员工,无论是IT管理者,还是软件开发人员,他们都能亲身体验到这种改变。
云计算的发展现状
60年的代麦卡锡
早在60年代麦卡锡(John McCarthy)就提出了把计算能力作为一种象水和电一样的公用事业提供给用户。云计算的第一个里程碑是,1999年Salesforce.com提出的通过一个网站向企业提供企业级的应用的概念。[4]
Amazon
Amazon使用弹性计算云(EC2)和简单存储服务(S3)为企业提供计算和存储服务。收费的服务项目包括存储服务器、带宽、CPU资源以及月租费。月租费与电话月租费类似,存储服务器、带宽按容量收费,CPU根据时长(小时)运算量收费。Amazon把云计算做成一个大生意没有花太长的时间:不到两年时间,Amazon上的注册开发人员达44万人,还有为数众多的企业级用户。有第三方统计机构提供的数据显示,Amazon与云计算相关的业务收入已达1亿美元。云计算是Amazon增长最快的业务之一。
Google
Google当数最大的云计算的使用者。Google搜索引擎就建立在分布在200多个地点、超过100万台服务器的支撑之上,这些设施的数量正在迅猛增长。Google地球、地图、Gmail、Docs等也同样使用了这些基础设施。采用Google
Docs之类的应用,用户数据会保存在互联网上的某个位置,可以通过任何一个与互联网相连的系统十分便利地访问这些数据。目前,Google已经允许第三方在Google的云计算中通过Google
App Engine运行大型并行应用程序。Google值得称颂的是它不保守。它早已以发表学术论文的形式公开其云计算三大法宝:GFS、MapReduce和BigTable,并在美国、中国等高校开设如何进行云计算编程的课程。
IBM
IBM在2007年11月推出了“改变游戏规则”的“蓝云”计算平台,为客户带来即买即用的云计算平台。它包括一系列的自动化、自我管理和自我修复的虚拟化云计算软件,使来自全球的应用可以访问分布式的大型服务器池。使得数据中心在类似于互联网的环境下运行计算。IBM正在与17个欧洲组织合作开展云计算项目。欧盟提供了1.7亿欧元做为部分资金。该计划名为RESERVOIR,以“无障碍的资源和服务虚拟化”为口号。2008年8月,
IBM宣布将投资约4亿美元用于其设在北卡罗来纳州和日本东京的云计算数据中心改造。IBM计划在2009年在10个国家投资3亿美元建13个云计算中心。
微软
微软紧跟云计算步伐,于2008年10月推出了Windows Azure操作系统。Azure(译为“蓝天”)是继Windows取代DOS之后,微软的又一次颠覆性转型——通过在互联网架构上打造新云计算平台,让Windows真正由PC延伸到“蓝天”上。微软拥有全世界数以亿计的Windows用户桌面和浏览器,现在它将它们连接到“蓝天”上。Azure的底层是微软全球基础服务系统,由遍布全球的第四代数据中心构成。
云计算的效果
云计算的新颖之处在于它几乎可以提供无限的廉价存储和计算能力。纽约一家名为Animoto的创业企业已证明云计算的强大能力(此案例引自和讯网维维编译《纽约时报》2008年5月25日报道)。Animoto允许用户上传图片和音乐,自动生成基于网络的视频演讲稿,并且能够与好友分享。该网站目前向注册用户提供免费服务。2008年年初,网站每天用户数约为5000人。4月中旬,由于Facebook用户开始使用Animoto服务,该网站在三天内的用户数大幅上升至75万人。Animoto联合创始人Stevie
Clifton表示,为了满足用户需求的上升,该公司需要将服务器能力提高100倍,但是该网站既没有资金,也没有能力建立规模如此巨大的计算能力。因此,该网站与云计算服务公司RightScale合作,设计能够在亚马逊的网云中使用的应用程序。通过这一举措,该网站大大提高了计算能力,而费用只有每服务器每小时10美分。这样的方式也加强创业企业的灵活性。当需求下降时,Animoto只需减少所使用的服务器数量就可以降低服务器支出。
我国的云计算发展
在我国,云计算发展也非常迅猛。2008年6月24日,IBM在北京IBM中国创新中心成立了第二家中国的云计算中心——IBM大中华区云计算中心;2008年11月28日,广东电子工业研究院与东莞松山湖科技产业园管委会签约,广东电子工业研究院将在东莞松山湖投资2亿元建立云计算平台;2008年12月30日,阿里巴巴集团旗下子公司阿里软件与江苏省南京市政府正式签订了2009年战略合作框架协议,计划于2009年初在南京建立国内首个“电子商务云计算中心”,首期投资额将达上亿元人民币;世纪互联推出了CloudEx产品线,包括完整的互联网主机服务"CloudEx
Computing Service", 基于在线存储虚拟化的"CloudEx Storage
Service",供个人及企业进行互联网云端备份的数据保全服务等等系列互联网云计算服务;中国移动研究院做云计算的探索起步较早,已经完成了云计算中心试验。中移动董事长兼CEO王建宙认为云计算和互联网的移动化是未来发展方向。另外,易度在线工作平台everydo
.com在云计算领域发展也很快,旗下的多款云计算产品,包括文档、项目、工作管理等,致力于解决中小企业的软件领域问题。
我国企业创造的“云安全”概念,在国际云计算领域独树一帜。云安全通过网状的大量客户端对网络中软件行为的异常监测,获取互联网中木马、恶意程序的最新信息,推送到服务端进行自动分析和处理,再把病毒和木马的解决方案分发到每一个客户端。云安全的策略构想是:使用者越多,每个使用者就越安全,因为如此庞大的用户群,足以覆盖互联网的每个角落,只要某个网站被挂马或某个新木马病毒出现,就会立刻被截获。云安全的发展像一阵风,瑞星、趋势、卡巴斯基、MCAFEE、SYMANTEC、江民科技、PANDA、金山、360安全卫士、卡卡上网安全助手等都推出了云安全解决方案。瑞星基于云安全策略开发的2009新品,每天拦截数百万次木马攻击,其中1月8日更是达到了765万余次。趋势科技云安全已经在全球建立了5大数据中心,几万部在线服务器。据悉,云安全可以支持平均每天55亿条点击查询,每天收集分析2.5亿个样本,资料库第一次命中率就可以达到99%。借助云安全,趋势科技现在每天阻断的病毒感染最高达1000万次。
值得一提的是,云安全的核心思想,与我国学者刘鹏教授早在2003年就提出的反垃圾邮件网格非常接近。刘鹏当时认为,垃圾邮件泛滥而无法用技术手段很好地自动过滤,是因为所依赖的人工智能方法不是成熟技术。垃圾邮件的最大的特征是:它会将相同的内容发送给数以百万计的接收者。为此,可以建立一个分布式统计和学习平台,以大规模用户的协同计算来过滤垃圾邮件:首先,用户安装客户端,为收到的每一封邮件计算出一个唯一的“指纹”,通过比对“指纹”可以统计相似邮件的副本数,当副本数达到一定数量,就可以判定邮件是垃圾邮件;其次,由于互联网上多台计算机比一台计算机掌握的信息更多,因而可以采用分布式贝叶斯学习算法,在成百上千的客户端机器上实现协同学习过程,收集、分析并共享最新的信息。反垃圾邮件网格体现了真正的网格思想,每个加入系统的用户既是服务的对象,也是完成分布式统计功能的一个信息节点,随着系统规模的不断扩大,系统过滤垃圾邮件的准确性也会随之提高。用大规模统计方法来过滤垃圾邮件的做法比用人工智能的方法更成熟,不容易出现误判假阳性的情况,实用性很强。反垃圾邮件网格就是利用分布互联网里的千百万台主机的协同工作,来构建一道拦截垃圾邮件的“天网”。反垃圾邮件网格思想提出后,被IEEE
Cluster 2003国际会议选为杰出网格项目在香港作了现场演示,在2004年网格计算国际研讨会上作了专题报告和现场演示,引起较为广泛的关注,受到了中国最大邮件服务提供商网易公司创办人丁磊等的重视。既然垃圾邮件可以如此处理,病毒、木马等亦然,这与云安全的思想就相去不远了。
2008年11月25日,中国电子学会专门成立了云计算专家委员会,聘任中国工程院院士李德毅为主任委员,聘任IBM大中华区首席技术总裁叶天正、中国电子科技集团公司第十五研究所所长刘爱民、中国工程院院士张尧学、Google全球前副总裁/中国区前总裁李开复、中国工程院院士倪光南、中国移动通信研究院院长黄晓庆六位专家为副主任委员,聘任国内外30多位知名专家学者为专家委员会委员。2009年5月22日,中国电子学会将于在北京中国大饭店隆重举办首届中国云计算大会。
云计算的20个基本定义
Markus Klems
云计算是一个囊括了开发,负载平衡,商业模式,以及架构的时髦词,是软件业的未来模式(Software
10.0),或者简单地讲,云计算就是以 Internet 为中心的软件。
Reuven Cohen
云计算是一种基于 Web 的服务,目的是让用户只为自己需要的功能付钱,同时消除传统软件在硬件,软件,专业技能方面的投资。云计算让用户脱离技术与部署上的复杂性而获得应用。
Jeff Kaplan
云计算这个词将在未来的一到两年内将炙手可热,人们会依此实现虚拟化并重造 IT 应用,创造出基于服务的业务模式。
Douglas Gourlay
云计算指的是一个大的宏图,基本上说,就是让用户透过 Internet 访问技术服务,现在,我每次登陆
Facebook 或搜索航班,事实上都是在使用云计算。
Praising Gaw
云计算就是新的 Web2.0,一种既有技术上的市场绽放。就象以前人们在自己的网站上放一点 ajax 就宣称自己是
Web2.0 一样,云计算是一个新的流行词。
积极的一面是,Web2.0 最终抓住了主流眼球,同样,云计算概念最终也会改变人们的思想,最终爆发出各种各样的概念,托管服务,ASP,网格计算,软件作为服务,平台作为服务,任何东西作为服务。
Damon Edwards
云计算还有很多令人费解的东西,然而不必如此复杂,只有三种服务是基于“云”的,SaaS,PaaS 和云计算平台。
Brian de Haaff
从消费者的角度看,SaaS 是云计算的一种,然而行业内的人必须明白这到底是什么意思。简单说,云计算就是SaaS的升华。
Ben Kepes
云模式的初衷是让硬件层的消费象按需计算,按所需存储空间那样进行,而为了让云模式带来更多力量,我们需要在整个应用架构中,在一个虚拟的环境中实现配制,部署,服务。
Kirill Sheynkman
我曾经和客户这样比喻云计算,我们可以把云计算比作“云厨”,我是一家的厨师,负责一家人的饭食,如果我的孩子想吃意大利食物,我就或做或订意大利饭给他,这些东西可能每天都变。拿我们的
Data Center 3.0 来说,你可以决定你的应用程序是在本地运行,还是在别的其它数据中心运行,如果发现资源不够,你也可以中途改变主意。事实上,基于自动化管理,你可以实时改变。
Omar Sultan
云计算就是为一些需要动态改变的需要访问资源与服务。应用和服务请求的资源来自“云”,而不是固定的有形的实体。云就是一些可以自我维护和管理的虚拟资源。
Kevin Hartig
云是一个庞大的资源池,你按需购买;云是虚拟化的;云可以象自来水,电,煤气那样计费。
Jan Pritzker
云计算是用户友好的网格计算。
Trevor Doerksen
云计算的意思是,外包的,用多少买多少的,各取所需的,一些来自 Internet 的东西。Thorsten
von Eicken要想讨论围绕着云计算这个概念的问题,我们需要在一个历史背景中进行,看看云计算的先驱者,他们所遇到的问题,会给我们一些指引,以避免同样的问题。
Paul Wallis
关于云计算的分布,我们可以借用金字塔模型。处于顶端的是那些只需要用户关心这是什么的一些应用,如 Gmail,
Hotmail, Quicken Online等等。
处于中间的是一些服务,你拥有逐渐增强的灵活性与可控制性,但仍受一些限制,Google App Engine,
Heroku, Mosso, Engine Yard, Joyent or force.com (SalesForce
platform) 一类的应用算这一类别。处于底端的是一些诸如 Amazon EC2, GoGrid,
RightScale 和 Linode 一类的架构。
Michael Sheehan
Web 与博客世界繁荣让人相信,任何应用都可以走向 Web 化,事实上,有些是可以的,但大部分不可以。可靠性,可扩展性,安全,以及一大堆问题会阻止多数公司将他们的核心业务放到“云”中,如果那样,出现问题的成本将非常高。Amazon
是云计算的领先者,但即使是 Amazon 也遇到很多问题,云计算还需要不断完善,它需要走的路可能比多数人估计的都要长。
Don Dodge
现在的高速网络,高性能图形处理器,快但并不贵的服务器和存储让工程师将越来越多的计算能力集中到数据中心,10年前,研究者们创造了网格计算的概念,而云计算将更强大。
Aaron Ricadela
当我们向不懂计算机技术的人提供虚拟技术的时候,我们希望虚拟或隐藏的是其复杂性。绝大多数人希望同应用或服务,而不是软件打交道。对于云计算,我们希望软件本身被虚拟或躲藏在系统或专业人员的背后,或者说“云”的背后。技术的发展也应了这句古话,总是螺旋上升的。早期的大型机时代,大型机集中了所有计算;而到了PC时代,计算能力则分布在每一台PC上;即将进入以“云计算”为代表的互联网时代之后,计算能力又将走向集中。
分布式计算的PC时代,创造了微软;集中式计算的“云时代”,创造了谷歌。与谷歌试图将所有计算和应用搬到“云”里不同,微软提出“云-端计算”的平衡理念:“云”和终端都将承担一部分计算和应用。
微软提出“云-端计算”的基础是:虽然“云计算”时代,由摩尔定律及WINTEL架构所决定的平衡正在打破,但一个由硬件、带宽、内容构成的新平衡正在形成:终端性能、带宽的发展,永远也赶不上内容的增长速度,三者总是维持一个动态的最佳平衡。
Irving Wladawsky Berger
在我看来,云计算就是将以前那些需要大量软硬件投资以及专业技术能力的应用,以基于 Web 服务的方式提供给用户。
掌握云计算其实也是一种利用互联网上的软件和数据的能力。
判断是否是云计算的两种种方法
第一:服务是否通过网络计算云实现,即终端用户只需要简单的输入输出;
第二:网络计算云提供的服务能力即服务节点数目是否能达到即时调整,即根据终端用户服务能力需求即时增加或减少到适当服务节点数目。
云计算的发展原因
-原因的概述
五个主要原因使得分布式计算必然会越来越普遍,逐渐发展成主流的计算模式而取代集中式的大型计算机:
1、高性价比
现在分布式系统的第一个原因就是因为他具有比集中式系统更好的性能价格比。你不要花几十万美元就能获得高效能计算。
2、应用分布性
多数应用本身就是分布式的。如工业企业应用,管理部门和现场不在同一个地方。
3、高可靠性。
冗余不仅是生物进化的必要条件,而且也是信息技术。现代分布式系统具有高度容错机制,控制核反应堆主要采用分布式来实现高可靠性。
4、可扩展性。
买一台性能更高的大型机,或者再买一台性能相同的大型机的费用都比添加几台PC的费用高得多。
5、高度灵活性。
能够兼容不同硬件厂商的产品,兼容低配置机器和外设而获得高性能计算。
-发展原因的详细解释
粗略地计算,目前的个人计算机每个CPU芯片的处理能力是200MIPS,就是每秒种执行200M也就是两亿次指令,而最近Yahoo!公司报道他们已经实现了有一万个节点(node)就是一万台PC计算机连接的分布式系统,总的处理能力是
2,000,000MIPS,最快的芯片也达不到这个速度,因为在一定面积上设计的芯片的速度是存在一个极限的,不可逾越。而当前世界著名的超级计算机所谓的TOP500,达到每秒几百万亿次指令执行,都是采用分布式设计的,世界第一的IBM
BlueGene超级计算机采用了32部机架,每部机架部署有768个PowerPC440 CPU。顺便说一句,这TOP500基本都是使用Linux操作系统的!现在社会和家庭拥有的个人计算机就是PC,只有30%的计算能力被利用,甚至更低,而其余70%的实际上是被闲置的,这些闲置的计算机资源和计算能力只有通过分布式系统才能得到有效的利用,这样可以大大提高一个国家的计算能力,而计算能力是衡量一个国家国力和科学研究能力的指标,这一点现在还没有被国人充分认识到。一个国家和地区的计算能力现在已经成为一种重要的战略资源,不亚于石油和其他战略物资的重要性。云计算就是把普通的服务器或者个人计算机连接起来以获得超级计算机也叫高性能和高可用性计算机的功能,但是成本更低。这在世界上也是个先进的项目。云计算模式必定能大大提高我国科学计算机和商业计算能力,使得我国经济竞争力大大提升。美国和欧洲有许多社会分布的分布式计算系统,他们动员和使用这些社会计算能力进行人类基因组学(Genomics)的研究、天文学问题研究、数学难题研究以及其他的科学问题研究。去年的一个研究报告估计我国个人计算机PC保有量接近两亿台。
按照计算机操作系统的宗师Andrew S. Tanenbaum(AST)给分布式系统的的定义:“分布式系统是这样的系统,它运行在不具有共享内存的多台机器上,但在用户的眼里却像是一台计算机”。(引自《现代操作系统》,机械工业出版社,1999年中文版)。它的目标是让每个用户感觉联网的计算机是一个分时系统——就像使用个人计算机一样
——而不是一个由许多计算机联合起来的集体,即使由五个节点组成的分布式系统也应该让用户感觉自己是在使用一台价值20万美元的大型计算机,唯一不寻常的感觉是处理速度提高了许多,别的没有什么不同。例如,这里有一个简单的例子,在机器A的用户要使用安装在机器B上用户的目录里的文件,A用户要使用远程登录命令rlogin
B登录到机器B的目录上,那么这就不是一个真正的分布式系统,因为用户A意识到了另外一台机器的存在,分布式系统必须要做到,用户A登录到一个目录上的时候不知道自己是在本地机器上还是在远程机器上的目录上,对于用户A来说机器B是透明的,这就是分布式系统设计时考虑的“透明性”要求。其他有关的问题包括:分布式文件系统的问题,目录和文件访问机制以及一致性问题,分布式系统进程的通信问题等等。目前的云计算严格说还没有到达真正的分布式计算的语义学水平。
云计算主要应用
亚马逊网站(Amazon.com,下称亚马逊)
是以在线书店和电子零售业起家的,如今已在业界享有盛誉,不过它最新的业务却与云计算有关。两年多以前,亚马逊作为首批进军云计算新兴市场的厂商之一,为尝试进入该领域的企业开创了良好的开端。
亚马逊的云名为亚马逊网络服务(Amazon WebServices,下称AWS),目前主要由4块核心服务组成:简单存储服务(Simple
StorageService,S3);弹性计算云(Elastic Compute Cloud,EC2);简单排列服务(Simple
QueuingService)以及尚处于测试阶段的SimpleDB。换句话说,亚马逊现在提供的是可以通过网络访问的存储、计算机处理、信息排队和数据库管理系统接入式服务。
谷歌公司(Google,下称谷歌)
围绕因特网搜索创建了一种超动力商业模式。如今,他们又以应用托管、企业搜索以及其他更多形式向企业开放了他们的“云”。
今年4月,谷歌推出了谷歌应用软件引擎(Google AppEngine,下称GAE),这种服务让开发人员可以编译基于Python的应用程序,并可免费使用谷歌的基础设施来进行托管(最高存储空间达
500MB)。对于超过此上限的存储空间,谷歌按“每CPU内核每小时”10至12美分及1GB空间15至18美分的标准进行收费。最近,谷歌还公布了提供可由企业自定义的托管企业搜索服务计划。
Salesforce
Salesforce是软件即服务厂商的先驱,它一开始提供的是可通过网络访问的销售力量自动化应用软件。在该公司的带动下,其他软件即服务厂商已如雨后春笋般蓬勃而起。Salesforce的下一目标是:平台即服务。
该公司正在建造自己的网络应用软件平台Force.com,这一平台可作为其他企业自身软件服务的基础。Force.com包括关系数据库、用户界面选项、企业逻辑以及一个名为Apex的集成开发环境。程序员可以在平台的Sandbox上对他们利用Apex开发出的应用软件进行测试,然后在Salesforce的AppExchange目录上提交完成后的代码。
微软公司
在云计算的起步阶段,微软曾经历过不少周折。经过几年的磨合调整之后,这个软件巨头的云计算战略终于走上了正轨。
根据有些厂商的预想,未来绝大部分的IT资源都将来自云计算,但微软却并不这么认为。几个月前,微软首席软件架构师(CSA)雷;奥兹(RayOzzie)曾表示,微软的宏伟计划是“提供均衡搭配的企业级软件、合作伙伴托管服务以及云服务”。简而言之,微软将其称为“软件加服务
”(software plus services)。
微软将在今年推出的首批软件即服务产品包括Dynamics CRM Online、Exchange Online、OfficeCommunications
Online以及SharePointOnline。每种产品都具有多客户共享版本,其主要服务对象是中小型企业。单客户版本的授权费用在5,000美元以上。针对普通用户,微软的在线服务还包括Windows
Live、Office Live和Xbox Live等。
云计算与网格计算的区别
云计算和网格计算本没有任何关系,至于云计算和分布式计算、效用计算等等概念,读者可以以此类推。
狭义云计算是指IT基础设施的交付和使用模式,指通过网络以按需、易扩展的方式获得所需的资源(硬件、平台、软件)。提供资源的网络被称为“云”。“云”中的资源在用户看来是可以无限扩展的,并且可以随时获取,按需使用,随时扩展,按使用付费。这种特性经常被称为像水电一样使用IT基础设施。
广义云计算是指服务的交付和使用模式,指通过网络以按需、易扩展的方式获得所需的服务。这种服务可以是IT和软件、互联网相关的,也可以使任意其他的服务。
云计算不是一种商业模式,不是一种付费模式,不是一种IT技术,不是一类IT产品,不是一种付费模式,不是SOA,不是虚拟化或虚拟化软件,不是简单地将购买变为租赁,不是分布式计算,不是高性能计算,不是网格计算,不是软件即服务(SaaS)。
网格计算是指分布式计算中两类比较广泛使用的子类型。一类是,在分布式的计算资源支持下作为服务被提供的在线计算或存储。另一类是,一个松散连接的计算机网络构成的一个虚拟超级计算机,可以用来执行大规模任务。该技术通常
被用来通过志愿者计算解决计算敏感型的科研、数学、学术问题,也被商业公司用来进行电子商务和网络服务所需的后
台数据处理、经济预测、地震分析等。
网格计算强调资源共享,任何人都可以做为请求者使用其它节点的资源,任何人都需要贡献一定资源给其他节点。网格计算强调将工作量转移到远程的可用计算资源上。云计算强调专有,任何人都可以获取自己的专有资源,并且这些资源是
由少数团体提供的,用户不需要贡献自己的资源。在云计算中,计算资源被转换形式去适应工作负载,它支持网格类型应用,也支持非网格环境,比如运行传
统或 Web2.0 应用的三层网络架构。网格计算侧重并行的计算集中性需求,并且难以自动扩展。云计算侧重事务性应
用,大量的单独的请求,可以实现自动或半自动的扩展。
网格的构建大多为完成某一个特定的任务需要,或者支持挑战性的应用。这也是会有生物网格、地理网格、国家教育网格等各种不同的网格项目出现的原因。而云计算一般来说都是为了通用应用而设计的。云计算一开始就支持广泛企业计算、Web应用,普适性更强。网格计算的主要思路是聚合分布的松散耦合资源。而云计算的IT资源相对集中,以Intenet的形式提供底层资源的获得和使用。
在对待异构性方面,二者理念上有所不同。网格计算用中间件屏蔽异构系统,力图使用户面向同样的环境,把困难留在中间件,让中间件完成任务。而云计算,不同的服务用不同的方法对待异构型,所有传统的方法在这里都可以应用。有的提供基础设施,类似传统的服务器,用户选择操作系统和应用环境,有的则屏蔽了操作系统、基础设施和系统软件的差异,比如Paas服务。
简言之,云计算和网格没有任何内在联系。网格计算一直在发展,只是它和云计算的出现没有任何关系。网格计算作为一种面向特殊应用的解决方案将会继续在某些领域存在,而云计算作为一场IT变革,则会深刻影响整个IT产业和人类社会。[5][6][7]
|