磁力泵厂家
免费服务热线

Free service

hotline

010-00000000
磁力泵厂家
热门搜索:
技术资讯
当前位置:首页 > 技术资讯

硅谷杂志展望云计算的发展趋势云计算研究综述新日

发布时间:2020-01-15 12:42:41 阅读: 来源:磁力泵厂家

【硅谷网11月4日文】据《硅谷》杂志2012年第16期刊文称,采用文献分析方法简述云计算的定义、分类、支撑技术和架构,从计算架构、编程模型和平台研究等方面介绍云计算的各项相关技术的研究现状和部分技术方案,展望云计算的发展趋势,可为云计算相关研究提供参考。

关键词:云计算;并行计算;虚拟化;按需使用

0引言

云计算(CloudComputing)是在2007年第3季度才诞生的新名词,它是在信息技术进步和应用需求拉动两方面成熟的条件下逐渐演化而来的。从最基本的层面来说,云计算是一种信息服务的交付和使用模式,即通过网络以按需、易扩展的方式获得所需的服务。这种服务可以是IT基础设施(硬件、平台、软件),也可以是任意其他的IT服务。云计算采用基于资源虚拟化的方式,实现计算与存储的分布式与并行处理,使用户能够按需获取计算力、存储空间和信息服务,是资源优化整合的新境界。通过对平台软硬件资源的共享以及对各类资源在更细粒度上的优化配置与动态调度,云计算可显著降低软硬件成本投入、能耗和管理成本,数据中心的利用率同样可以被大幅度提高。因此,与传统计算模式相比,云计算模式的整体效益可提高约30倍以上[1]。

1云计算的定义

维基百科给云计算下的定义为:云计算(cloudcomputing),是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需提供给计算机和其他设备。整个运行方式很像电网[2]。

业界和科学家们对云计算定义的范围尚存在不少分歧,但基本共识认为云计算就是基于网络和虚拟化技术的,优化集中系统计算能力以满足多终端并行多任务需求的,达到特定服务水平协定的,实时弹性的计算处理执行环境,是虚拟化的IT资源服务集合。

2研究进展

2.1云计算的架构

一般来说,云计算环境的体系结构可以分为三层:基础设施层,平台层和应用程序层,如图1所示。

基础架构层:也称为虚拟化层,通过使用虚拟化技术(如Xen,KVM和Vmware)划分物理资源,基础设施层创建计算资源的存储池。基础设施层是云计算的重要组成部分,很多关键功能(例如动态资源分配)只是通过虚拟化技术实现。这层的作用是将各种底层的计算和存储等资源作为服务提供给用户。

平台层:构建在基础设施层之上,由操作系统和应用程序框架组成。平台层的目的是尽量减少直接部署应用程序到虚拟机的负担。例如,谷歌应用程序引擎运行在平台层,提供API支持实现数据存储、数据库和典型的web应用程序。这层的作用是将一个应用的开发和部署平台作为服务提供给用户。

图1云计算的架构

Fig.1ArchitectureofCloudComputing

应用程序层:在层次结构的最上层,部署实际的云应用程序。不同于传统的应用程序,云应用程序可以利用良好的伸缩性实现更好的性能、可用性、低运营成本等优点。这层的作用是将应用主要以基于Web的方式提供给客户。

云计算的物理实体是数据中心,由“云”的基础单元(云元)和“云”操作系统,以及连接云元的数据中心网络等组成。按照云计算服务提供的资源所在的层次,可以分为IaaS(基础设施即服务)、PaaS(平台即服务)和SaaS(软件即服务)等。云计算又可分为面向机构内部提供服务的私有云,面向公众使用的公共云,以及二者相结合的混合云等。

2.2编程模型

云计算编程模型以MapReduce[3]和Dryad为代表,其他的大体上是这两种方式的变种。

MapReduce是Google提出的一个支持并行计算的软件架构,适用于对大规模数据集的并行处理。其核心思想是引入了“Map(映射)”和“Reduce(化简)”概念和处理机制。

MapReduce的主要思想是将要执行的问题分解成两个并行阶段,Map阶段和Reduce阶段:先通过Map函数将问题分解,并将数据分割成不相关的区块,分配给服务器并行处理;再通过Reduce函数将结果归约汇总输出。在这种分布式处理系统的可靠性支持方面,利用工作节点周期性和主控节点报告其自身活动状态,实现对异常节点(保持沉默超过一个预设的时间间隔)的识别、监控与隔离,并将分配给相应工作节点处理的数据迁移至其它活动节点,利用原子操作保证机制,防治并行线程间的冲突。

Dryad[4]是微软提出的针对数据并行的简单编程模型。具体而言,Dryad将任务抽象为图中结点,而由运行环境将这些结点映射到可用的计算结点中去。在Dryad模型中,任务节点的划分非常灵活,并通过支持多核和集群进一步提高了并行处理能力。相对于MapReduce模型,Dryad不足在于由于采用任务节点的划分机制,增加了数据分类的复杂性,数据描述的简洁性较MapReduce差。目前,改进的Dryad模型可完全兼容MapReduce模型,逐渐成为通用性更强的数据并行处理模型。DryadLINQ[5]将Dryad与微软的.Net语言级集成查询(.NetLanguageIntegratedQuery)进行整合,从而用户只需编写类似SQL之类的查询语言就可实现对大规模数据的操作。

2.3云计算平台研究的现状

由于云计算是多种技术混合演进的结果,其成熟度较高,又有大公司推动,发展极为迅速。亚马逊、Google、IBM、微软和Yahoo等是云计算的先行者。VMware、Facebook和YouTube等在云计算不同领域都极具特色。对于学术界来说,目前研究中用到的比较成熟的开源云计算平台有Hadoop、Enomalism、Eucalyptus、Nimbus、10Gen等。

Google是云计算最初的提出者和使用者,也是目前云计算最大的实践者。Google云计算的快速发展得益于构成其基础架构的的三个系统,包括Google分布式文件系统(GFS)[6]、大规模分布式数据库BigTable[7]以及针对Google应用文件的特点提出的MapReduee。通过使用这些技术,Google布置了大量云服务,比如:GoogleMap,Gmail,GoogleDocs等。此外,Google还提供了云开发服务,这些服务通过GoogleAppEngine运行大型并行应用程序的形式提供,使得开发者能够利用Google强大的应用所依托的相同基础设施来构建他们自己的应用。

由Amazon提出的云计算架构基于大规模集群之上,由核心由4类服务组成:简单存储服务(SimpleStorageService);弹性计算云(ElasticComputeCloud,EC2)[8];简单队列服务(SimpleQueuingService)以及尚处于测试阶段的SimpleDB。在Amazon云计算环境中,用户仅需运行自己的服务实例,即可获得平台提供的计算、存储等云服务,服务实例虚拟机的创建、维护及注销均对用户透明,用户按使用实例的方式付费。

IBM基于其在大规模数据计算和超级计算机领域的技术优势,提出了BlueCloud[9]架构。“蓝云”平台的核心是虚拟化技术和存储技术。“蓝云”中的虚拟化是通过硬件和软件两级虚拟化来实现。IBM云平台的存储架构支持Google文件系统和存储区域网络(SAN)两种模式,并且这两种模型可单独使用也可以合二为一使用。

Hadoop是一种开源且基于MapReduce并行编程模型的集群实现,也是目前最具代表性的云计算平台架构方案[10]。在Hadoop中,底层数据管理是采用与GFS的文件系统类似的(HadoopDistributedFileSystem,HDFS)分布式数据管理技术,其功能与GFS的文件系统类似,但是Hadoop的这种分布式文件系统还具备自动容错的功能。Hadoop是基于MapReduce的编程模型实现的并行系统,所以具备MapReduce的优点,对于大规模数据的并行访问处理具有较高效率,由于使用Java语言实现,具备很好的跨平台特性,因为目前应用也最为广泛。

4结束语

云计算并不是从无到有的全新概念,是在应用需求拉动和技术进步两方面成熟的条件下逐渐演化而来的。云计算的本质,是在软硬件技术发展到一定阶段后,必然要出现的一种计算资源整合模式。云计算应用是趋势,但尚处培育发展期,现阶段已经提出了很多好的商业模式和技术实现设想,但技术上还有很多的问题和挑战。今后无论云计算演化成其他形式的“X计算”,仍有推进此产业发展的必要。本文介绍了云计算系统的基本概念、架构和相关技术,介绍了云计算领域的研究现状并展望了云计算的发展趋势。

(责任编辑:硅谷网·)

上一篇:硅谷杂志:基于ASP.NET的移动Web应用探究

下一篇:使用二维码扫描越来越多,互联网又是一比暴利收入 对“硅谷杂志:展望云计算的发展趋势 云计算研究综述”发布评论

网上预约挂号服务平台

在线网上挂号

挂号平台网上预约

免费24小时在线医生