当前位置: 首页 精选范文 云计算的概述范文

云计算的概述精选(五篇)

发布时间:2023-09-26 09:35:04

序言:作为思想的载体和知识的探索者,写作是一种独特的艺术,我们为您准备了不同风格的5篇云计算的概述,期待它们能激发您的灵感。

云计算的概述

篇1

关键词:云计算;大数据;数据容灾

中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2014)32-7574-02

1 概述

当代云计算数据中心的存储节点数量少则几十万多则上百万,在规模如此庞大的海量存储系统中,节点失效或磁盘损毁已然成为一种常态,此外,由于网络设备或者传输线路故障等原因导致的数据丢失或短时不可用现象也常有发生。如果用户或企业不能随时随地存取自己所需的数据,甚至发生数据丢失的现象,将大大影响客户满意度,甚至给企业带来巨大的经济损失,因此,必须采取有效措施及相关技术策略来保证云端数据的可靠存储。

2 云端数据中心拓扑结构

云端数据中心是大数据存储的基础平台,数据的可靠性及访问效率与网络节点的拓扑结构紧密相关。按节点功能类型的不同,可将数据中心节点的拓扑结构分成三种类型[1]:①以server(服务器)为为中央节点的星型结构;②以 switch(交换机)为中央节点的星型结构;③混合结构。三种拓扑结构的特点如下:

以server为中央节点的结构将多台server通过传输介质直接互连起来,在这种结构中,server兼任switch的角色,一方面承担数据的加工处理工作,另一方面承担分组的存储转发工作,以server为中心的结构增加了服务器之间的网络带宽,摆脱了对交换机的过度依赖,提高了吞吐量;但是server之间的链路带宽的不均衡增加了布网的复杂度。

以switch为中央节点的结构将各台server通过switch进行互连,switch和server各司其职,switch负责分组的路由转发,server负责数据的存储加工,这种结构布网简单,操作方便,可扩展性强,在现代企业数据中心应用较广泛;但以交换机为中心的结构存在底层server利用率低、switch资源浪费较为严重、网络带宽容量有限、灵活性差等缺点。

混合结构是以上两种结构的一种扩展,其设计融合了这两种结构的优点并有效避开了各自的缺陷。

3 云端数据容灾技术

容灾技术是云端大数据可靠存储的一种关键技术,良好的容灾策略不但能有效提升大数据存储系统的可靠性,还有助于提升系统的访问效率。容灾策略一般都采用冗余备份技术来实现,以确保当出现某种突发状况导致存储系统中的文件、数据、片段丢失或者严重损坏时,系统可准确而快速地访问冗余数据来维持系统的稳定运行[2]。一般来说,容灾技术按策略的不同主要分两种:①复制冗余策略;②纠删编码冗余策略。

3.1 复制冗余策略

复制冗余策略为系统中的每一个数据都建立一个或多个副本,并把若干个副本分散存储在不同的网络节点上,当遇到某个数据损毁或失效不能正常使用时,可通过访问最近的存储节点来获取与原件完全一致的副本数据[3]。基于复制的冗余策略主要关注2个方面的问题:(1)副本数量设置;(2)数据放置方法。

3.1.1副本数量设置

副本系数设置主要采取两种方式: ①静态设置副本数量,目前主流的分布式文件系统Hadoop的HDFS、谷歌的GFS都采用3副本策略,这种静态设置方法操作简单,但灵活性差;②随机动态设置副本数量,即系统根据数据的访问频率、出错概率及网络状况等动态因素随机地确定副本系数,动态地删除或添加副本,这种动态机制能大大增加存储空间的利用率,但动态计算过程增加了系统的开销;

3.1.2数据放置方法

巧妙的数据放置方法能通过提高并行访问量来提升云端大规模数据的访问效率,目前,数据放置方法一般采用顺序放置和随机放置[4]。

①顺序放置方法把数据副本按顺序分布存储在不同节点上,使得排列数目相对较少,针对系统的随机失效有一定的防护性,顺序放置方法技术简单、易于实现和维护,但在具体应用时,因失效具有很强的相关性,局部的网络故障或节点失效就有可能导致整个机架的数据不可访问。

②随机放置方法是在可放置节点中随机地选择一系列节点来存放数据副本,此方法能够降低关联对系统可靠性带来的负面影响,但在实际应用中,由于节点的存储、计算能力各不相同、数据的访问热度也不尽一致,往往达不到理想的均衡负载效果。

3.2纠删编码冗余策略

3.2.2 LDPC编码

LDPC码是从蒙特卡洛及图论演进而成的编译码技术,因其稀疏检验矩阵(少量元素是1,其余部分全是0)特性,被研究者广泛用于设计复杂度低的解码算法,LDPC码可以有效提升系统的容灾能力,但是构造不规则码字的难度也相应成倍地增加。

3.2.3阵列编码

阵列码的编译码过程只涉及基础的二进制异或运算,技术实现相对容易,而且在采用同等编译码的前提下,阵列码比RS码更能有效地提高系统的可靠性,与此同时保持其计算域不变大,阵列码技术一直是大数据可靠存储关键技术的研究热点,被广泛的应用于磁盘阵列及网格存储系统中。

3.2.4 RS编码

RS码是一种高效的纠错码,既可以纠正突发错误,又可以纠正随机错误,在通信领域中有极其广泛的应用,近年来,随着大数据存储技术的快速、多元化发展,有研究者对RS编码行了改造,并将其应用于数据存储领域以提高系统的容错性。

4 云端系统节能减耗技术

数据存储是各种云计算服务赖以施展的基础,在云计算环境下,底层数据中心节点的规模庞大,使得数据存储成本极高,主要源于添置各种网络硬件设施(大型服务器、交换机、路由器等)以及支付各种存储设备的高额电能消耗等。高涨的能耗开销不但增加了系统的运营及维护成本,更催化了大气温室效应,严重破坏了自然界的生态环境,因此,不论从服务商盈利的角度,还是从环境保护的角度出发,节能减耗技术都显得尤为必要。

当前,分布式存储系统的节能减耗技术主要集中在两个方面:①硬件节能策略,主要致力于降低存储系统中的硬件设备能耗;②软件节能策略,通过使用一些专业软件来实现系统资源的有效分配及使用。

参考文献:

[1] Popa L, Ratnasamy S, Iannaccone G,et al. A Cost Comparison of Data Center Network Architectures[Z]. 2010.

[2] 吴朱华.云计算核心技术剖析[M].北京:人民邮电出版社,2011.

[3] 郭仁东.网络数据容灾备份技术及其应用浅析[J].电脑知识与技术,2012(31).

篇2

1.云计算的定义

云计算是一种基于互联网的超级计算模式。它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和各种软件服务。云计算实质上是通过互联网访问应用和服务,而这些应用或者服务通常不是运行在自己的服务器上,而是由第三方提供。它的目标是把一切都拿到网络上,云就是网络,网络就是计算机。云计算依靠强大的计算能力,使得成千上万的终端用户不担心所使用的计算技术和接入的方式等,都能够进行有效的依靠网络连接起来的硬件平台的计算能力来实施多种应用。云计算的新颖之处在于它几乎可以提供无限的廉价存储和计算能力。

基于云计算的原理和其固有的特点,云计算比其它新技术更容易进入高校。云计算对用户端的设备要求很低,这一特点决定云计算将会在学校大受欢迎。

2.云计算的特点

(1)服务提供的多元性

云就是庞大的计算机群,具备极高的计算、存储能力,能够完成单机所完不成的海量计算、存储等工作。云将调用云中的计算机群,使用基于海量数据的数据挖掘技术来搜索网络中的数据库资源,并运用各种方法为用户反馈出尽可能详尽、准确的结果,极大的扩展了而不是传统意义上的基于某个具体服务器为用户提供相应服务的工作模式;同时云中的计算机可以通过相应技术保持网络数据库信息的及时更新,用以保证用户服务的快速、准确。

(2)使用的便捷性

在云计算模式中所有应用和服务请求的数据资源均存储在云中,用户可以在任意场合、时间通过网络接入云平台,使用统一的云服务,按照自身的需求获取所需信息,并可以实现不同终端、设备间的数据与应用共享,为工作带来极大的便利和效率。

(3)服务的安全性

分布式系统具有高度容错机制,云计算作为分布式处理技术的发展,依托据存储中心可以实现严格、有效的控制、配置与管理,具有更好的可靠性、安全性和连接性能,同时高度集中化的数据管理、严格的权限管理策略可以让用户避免数据丢失、病毒入侵等麻烦。

(4)用户端设备成本低廉

由于云计算模式下大量的计算及存储工作都被放到了网络上,作为个人的用户端就完全可以简化到只有一个浏览器了。云计算模式中用户只需通过网络使用服务商所提供的相关服务,并按实际使用情况付费,具体的计算机系统硬件配置、设备运行维护开支和服务器系统软、硬件升级都由云服务提供商来完成。云计算的端设备和现在的PC机相比,云计算终端功耗低,成本低廉,终端用户使用简单,维护方便。

二、云计算为高校教育信息化建设提供新的思路

1.云计算能大大节约信息化的资金投入

目前的高校信息化建设中成本主要来源于软硬件的购置、日常维护及设备更新等,如果将这些建立在云计算和服务的基础之上,将大大减少资金投入。其一,整个网络课程建设的基础平台将是云服务提供商提供的跨平台、运算能力强大、资源丰富的统一的通用信息平台,无需购买本地服务器,仅需投入少数管理终端及云接入设备即可;其二,所有的服务提供均由云端提供,无需为保证服务器运行的可靠性、保证存储在服务器中的数据资源的安全以及避免因网络访问异常导致服务器瘫痪而对网络服务器响应及接入数量等进行限制,因此原来维护、升级等工作几乎降至最低,管理成本也相应可以大大降低。

2.真正实现资源整合,建立统一的资源平台

将高校信息化建立在云计算和服务的基础之上,将繁重的网络信息平台建设、服务器的配备、课程资源的存储与管理等工作交给云服务提供商,那么现有分散的、自成一体、本地化的网络信息平台将转变成为一个与具体网络运行环境、网络服务器系统、网络操作系统无关的强大的统一的通用信息平台,在这个平台上以成千上万的云服务器为依托,拥有着极其强大的计算功能、海量的网络资源,现有的网络课程建设中存在的软、硬件资源重复投入、虚拟化教学设备运行能力支持等问题将迎刃而解。

3.云计算的应用能够保证高校师生的信息安全

校园网内的计算机病毒的防控一直是一个十分棘手的问题,尤其在多媒体教室及计算机实验室。一台机器中毒,很快就会传遍所有机器。杀毒软件授权使用费用对高校来说也是一笔不小的开支,但对病毒仍不能有效的防控。而在云计算环境下,云计算提供商拥有先进技术和专业团队来负责这些资源的安全维护工作,师生们只需通过网络,就能访问自己的数据。本地不再存储任何数据,因而不用担心病毒入侵造成的破坏。所以,云计算在高校的应用既省去了高校在信息安全方面的开支,又确保了高校师生的信息安全。

篇3

关键词: 改进密钥; 云计算数据; 安全存储; 帐篷映射; 猫映射

中图分类号: TN911?34; TP393 文献标识码: A 文章编号: 1004?373X(2016)20?0031?04

Abstract: As the data size is large in cloud computing environment and the existing data has the dynamic change characteristics, the cloud computing data security storage strategy based on the improved secret key is proposed because the traditional secure storage method obtains the relatively small key space by low dimensional mapping, which may cause low security, is easy to crack, and makes the storage security worse. The general description of tent mapping and cat mapping is given in this paper. It converts the real number domain to the integer domain to make integer arithmetic. The tent mapping and cat mapping are imported to improve the secret key parameters, and get the primarily?iterated secret key. The complementation operation and xor operation for the obtained results are conducted to acquire even encryption cipher byte and verify whether the even encryption is completed, and judge whether the iteration should be finished. In this way, the security storage of cloud computing data is achieved. The experimental results show that the proposed strategy has not only higher safe storage performance, but also needs less time, and does not increase the burden of cloud computing system.

Keywords: improved secret key; cloud computing data; safe storage; tent mapping; cat mapping

0 引 言

云存储是在云计算(Cloud Computing)概念上延伸和发展出来的一个新的概念,是一种新兴的网络存储技术,它主要通过集群应用、网络技术或分布式文件系统等功能,将网络中大量不同类型的存储设备获得的数据,通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统[1?3]。随着云计算的广泛应用,人们对云计算数据存储的安全性要求越来越高,因此,研究云计算安全问题具有重要意义,已经成为相关学者研究的重点课题,受到了越来越广泛的关注[4?5]。

目前,有关云计算数据安全存储的研究有很多,相关研究也取得了一定的成果。文献[6]提出基于加密机制的云计算数据可靠存储方法,主要通过数字证书向云计算系统进行身份验证,采用对称密钥对云计算数据进行加密再发送至云计算系统中保存,如果客户需得到数据,就要把云计算环境下的密文传输至本地,由客户独立进行解密;但该方法需要很强的计算能力,并且加密密钥需妥善保管,若丢失则不能获取存储的数据。文献[7]提出基于第三方核查的云计算数据安全存储方法,将同态认证的公钥技术与随机masking技术结合在一起,通过零知识证明协议与语义匹配方法实现云计算数据的安全存储。但该方法耗费资源较多,成本相对较高;文献[8]提出的云计算数据安全存储策略,主要通过扩展分离密钥对保存在云环境中的加密数据操作过程进行密钥管理,将对称密钥存储在云环境中,供用户查找;但该方法实现过程复杂,不适用于实际应用中。文献[9]提出基于可信平台的云计算数据安全存储策略,该策略依据可信平台模块,对对称密钥与非对称密钥分别进行管理,实现云计算数据的安全存储;但该方法存在所需时间较长,效率低的问题。文献[10]提出一种安全可扩展的云计算数据安全存储策略,通过重加密的技术对数据进行安全存储,该方法重加密密钥与解密密钥所涉及的数据量很大,对其的管理非常困难,有安全隐患。

1 云计算数据安全存储策略设计

1.1 密钥参数的获取

采用帐篷映射和猫映射共同获取密钥的方法,对传统方法进行改进,则需分别求出帐篷映射的密钥参数和猫映射的密钥参数。

1.1.1 基于帐篷映射的密钥参数获取

式中,[w]用于描述云计算字长,因为猫映射的拉伸和折叠使[xk,yk∈0,2w-1],说明猫映射迭代值恰好处于云计算字长所能描述的整数区间中(除去[2w]断点),因此,式(6)是在云计算字长所能描述的整数区间中的迭代运算,适用于云计算存储。

针对式(6)获取的所有整数迭代解,仅在[x,y]同时为零的情况下可获取一个稳定的零解,为了避免上述情况的发生,达到改进整型猫映射的状态,可通过检测下一次输入值是否同时为零进行优化处理,若为零,则将输入值用其他值代替。

通过以上分析过程可以看出,式(6)中存在2个初始条件,即通过猫映射得到的密钥,该方程比一维方程更加复杂,从而有效地保证了云计算数据存储的安全性,则经改进的密钥参数可描述成[xn],[yn],[Zn],[a]。

1.2 基于改进密钥的数据安全存储的实现

将改进的密钥参数应用于云计算数据安全存储中,复杂度适中,而且计算效率高,安全性得到了很大的保证,详细的流程图如图1所示。

基于改进密钥的云计算数据安全存储过程如下:

(1) 初始化密钥:将帐篷映射和猫映射的初始值[x0],[y0],[Z0]和可变控制参数[a]看作是初始密钥;

(2) 初始化迭代:针对已经选择好的初始密钥依次进行10次迭代处理,有效地掩盖原始值,增加帐篷映射的雪崩效应,增强数据存储的安全性;

(3) 迭代结果:得到经初始迭代后的密钥,首先进行帐篷映射处理,将[Z0]看作是初始参数代入式(3)中迭代一次获取[Z0′],再将[Z0′a]和[y0]的乘积作为Henon映射的初始参数代入式(6)中迭代一次获取[xn]和[yn],二者的乘积就是最终的迭代结果,用[P]进行描述,表达式为:

(6) 终止判断:通过式(9)得到的密文字节,可验证云计算数据明文字节序列[M]是否均加密完成,若完成则退出,实现云计算数据的安全存储;反之,转入步骤(3),继续进行安全存储操作,直到完成云计算数据明文序列的均匀加密处理,实现对云计算数据的安全存储操作。

2 实验结果分析

为了验证本文提出的基于改进密钥的云计算数据安全存储策略的有效性,需要进行相关的实验分析。首先建立云计算环境,将n台计算机看作是存储节点,所有存储节点的配置均一致,详细操作环境如下:内存为4 GB,硬盘为250 GB,操作系统选择Windows XP,通过Cygwin对云计算环境进行仿真,同时建立Hadoop开源平台。实验将Henon映射方法作为对比进行分析。

本文将存储耗时作为指标对本文改进方法与传统的Henon映射存储方法进行对比实验。在云计算数据大小一定的情况下,分别采用本文方法和Henon映射对云计算数据进行存储,得到的效率比较结果如表1所示。

分析表1可知,采用本文方法对云计算数据进行存储,虽然随着文件的逐渐增加,所需的时间也逐渐增加,但是和Henon映射方法相比,本文方法所需的时间还是较低的,说明采用本文方法相比Henon映射方法存储效率更高。

数据存储安全性是衡量本文方法有效性的关键指标,表2描述了本文方法和Henon映射方法为了达到同一安全水平所需的密钥长度,表2中同一行代表同一安全水平。分析表2可以看出,1 135 b的Henon映射法,其安全水平和203 b的本文方法相当,也就是说203 b的本文方法的安全性已经远远高于203 b的Henon映射方法的安全性了,而且随着密钥长度的逐渐增加,两种方法安全性的差异也越来越大,说明本文方法的安全性较高。

为了更加直观地对两种方法的安全性进行比较,对采用的本文方法和Henon映射方法的安全程度进行比较分析,得到的结果如图2所示。

分析图2可以看出,在相同的条件下,采用本文方法的安全性能为95%,Henon映射方法的安全程度为59%,与和Henon方法相比,采用本文方法对云计算数据进行存储的安全程度高出了36%,进一步验证了本文方法的高安全性。

为了验证采用本文方法和Henon映射法后对原云计算系统产生的影响,将经两种方法处理后的云计算系统服务端性能进行比较,得到的结果如表3所示。

分析表3可以看出,采用改进方法其服务器的占用率为3.81%(平均值),下载速度为13.05 Mb/s(平均值);传统的Henon映射法服务器的占用率为10.55%(平均值),下载速度为4.25 Mb/s(平均值);改进方法相比传统的Henon映射法,服务器占用率减少了9.24%(平均值),下载速度增加了6.3 Mb/s(平均值)。在加入本文方法密钥存储服务后,云计算系统的性能明显更高,说明本文方法对云计算系统产生的影响不大,CPU占用率与下载速度均较优,进一步验证了本文方法的有效性。

3 结 论

针对传统方法存在的问题,提出基于改进密钥的云计算数据安全存储策略,给出帐篷映射和猫映射的一般描述,将其由实数域转换成整数域进行整数运算,通过帐篷映射和猫映射获取改进密钥参数并进行初始化处理,得到经初始迭代后的密钥,再进行异或运算,得到密文字节。通过验证云计算数据明文字节是否均加密完成,判断是否结束迭代,实现对云计算数据的安全存储。实验结果表明,所提策略不仅安全存储性能较高,而且所需时间少,不增加云计算系统的负担。

参考文献

[1] 蛟平埽白杨.基于Hadoop和双密钥的云计算数据安全存储策略设计[J].计算机测量与控制,2014,22(8):2629?2631.

[2] 周明快.基于CP?ABE的云计算改进属性加密安全访问控制策略设计[J].计算机测量与控制,2015,23(1):297?299.

[3] 王志中,周城,牟宇飞.基于分离密钥的云存储加密解决方案[J].电信科学,2013,29(1):51?56.

[4] 晁巍.适于大数据存储的容错方案和安全方案设计及其在云计算系统中的应用[D].昆明:云南大学,2014.

[5] 刘占斌,刘虹,火一莽.云计算中基于密文策略属性基加密的数据访问控制协议[J].信息网络安全,2014(7):57?60.

[6] 赵莉,王魁t.基于加密机制的云计算数据可靠存储方案研究[J].信阳师范学院学报(自然科学版),2014(4):593?596.

[7] 毛黎华.基于云计算用户数据传输与存储的安全策略研究[J].电子技术与软件工程,2014(13):234.

[8] 张少敏,李晓强,王保义.基于Hadoop的智能电网数据安全存储设计[J].电力系统保护与控制,2013(14):136?140.

篇4

一、 Apriori 算法描述与问题分析

1.算法描述

Apriori算法是挖掘产生布尔关联规则所需频繁项集的基本算法,也是一个很有影响的关联规则挖掘算法。Apriori算法就是根据有关频繁项集性质的先验知识而命名的。该算法使用一种称作逐层搜索的迭代方法,利用k 项集来产生(k +1)项集。具体包含两个主要的处理步骤,即连接和删除。以用Lk-1来产生Lk为例,挖掘过程如下:

(1)连接步骤:为发现Lk,通过将Lk-1与自身连接产生候选 k 项集的集合Ck 。设I1 和I2为Lk-1中的两个项集,Ii[j]表示Ii中的第j个项。为方便起见,Apriori假定事务或项集中的项按字典次序排序。对于(k +1)项集Ii,意味将项排序,使Ii[1]< Ii[2]

(2)删除步骤:Ck是Lk的一个超集,其中的各项集不一定都是频繁项集,但所有的频繁K项集一定都在Ck中,即有Lk ∈Ck。扫描一遍数据库就可以决定Ck中各候选项集的支持度计数,并由此获得Lk中各个元素(频繁k项集)。所有支持度计数不小于最小支持度计数的候选项集就是属于Lk的频繁项集。然而由于Ck中的候选项集很多,如此操作所涉及的计算量是非常大的。

为提高频繁项集逐层产生的效率。Apriori算法有一个用于缩小频繁项集的搜索空间的性质:"频繁项集的所有非空子集也必须是频繁的"。也就是说,若一个候选k项集中任一个子集项集不属于Lk-1,那么该候选k项集也不可能是频繁的,因而也就可以将其从Ck中删去。

Apriori 算法的优点是结构简单,易于理解,没有复杂的推导。另外,算法应用 Apriori性质在许多情况下大大缩小了需要检查的候选规模,使算法效率大幅度提高。

2.存在问题分析

Apriori 算法存在两个主要的问题:

(1)多次扫描数据库

Apriori 算法在每进行一次迭代的时候需要扫描一次数据库,一般当挖掘出的最大频繁项集的长度为N时,需要扫描 N 次数据库。而在实际应用中,经常需要挖掘很长的模式,多次扫描数据库将带来巨大开销。

(2)可能产生大量候选频繁项集

Apriori 算法在迭代过程中要在内存中产生、处理和保存候选频繁项集,这个数量有时候是非常巨大的。例如,如果有104 个频繁 1 项集,则 Apriori 算法要产生接近57个候选 2 项集。另外,为了发现长度为 100 的频繁模式,它必须产生多达2100≈1030个候选,导致算法在广度和深度上的适应性很差。

总之,Apriori 通过对数据库的多趟扫描来发现所有的频繁项集,而对存储海量数据的数据库的多趟扫描将耗费大量时间和内存空间,这将成为 Apriori 算法的瓶颈。为此,近年来有关并行数据挖掘算法的研究不断升温。

二、改进方案

1 第一种改进

具体的改进思路是:

(1)把事务数据库水平均匀的分成规模相当的 n 个数据子集,把数据子集发送到 m 个节点。

(2)每个节点扫描它的数据子集,产生一个局部的候选 k 项集的集合,记作 ,每个候选k 项集的支持度计数为1。

(3)利用分区函数将 m 个节点产生的中间结果Cp 分成r个不同分区,然后连同它们的支持度计数发送到r 个节点。

(4)r 个节点把相同项集的计数累加起来,产生最后的实际支持度,与最小支持度计数min_sup比较,确定局部频繁 k 项集的集合 。

(5)把 r 个节点的输出合并即产生全局频繁 k 项集的集合Lk。

(6)改进的Apriori算法的优势是查找Lk和Lk+1的过程是完全独立的,他们之间没有联系,这是一个循环的过程。k 值从1开始递增,直到找出所有的频繁项集。也可以设定k 的值,只需要查找Lk,或是从L1到Lk之间的所有频繁项集。

将改进的Apriori算法用MapReduce实现的优势是:第一,对事务数据库的扫描次数减少;第二,查找频繁项集的过程可以并行执行,当查找频繁k项集的流程执行的中间结果都被传送到分配了Reduce任务的工作站点时,Master就可以调度分配了Map任务的工作站点开始查找频繁 k +1项集,加快并行处理速度,极大地提高执行效率。

2第二种改进

上述改进算法尽管执行效率比较高,但仍然需要对事务数据库进行多次扫描,生成频繁 1 项集到频繁k 项集需要扫描k 次事务数据库,耗费了大量时间。所以对 Apriori 算法再次改进,改进后的算法只需要扫描事务数据库一遍,就可以产生全部的频繁项集,依然是用在云计算平台上。具体的改进思路如下:

(1)把事务数据库水平均匀的分成规模相当的n个数据子集,把数据子集发送到m个节点。

(2)每个节点扫描它的数据子集,产生一个候选项集(候选1项集到候选k项集)的集合,记作Cp,每个候选项集的支持度计数为1。

(3) r个节点把相同项集的计数累加起来,产生最后的实际支持度,与最小支持度计数min_sup比较,确定局部频繁项集的集合Lp。

(4)把r个节点的输出合并即产生全局频繁项集的集合L。

改进的Apriori算法的优势是只需要扫描一遍事务数据库就能找到所有的频繁项集。

小结:Google 的 MapReduce 库把输入文件平均分成 N 个数据片段,然后均匀的分配给 M个节点,由于云计算环境下的集群系统是异构的,所以这种方法并不能充分地利用集群中的计算资源,本文针对云计算环境的并行计算条件和并行挖掘需求在数据集划分和数据集分配方面做了研究。并且,本文对 Apriori 算法进行了两种改进,使其在云计算环境下能够并行进行海量数据的频繁项集的挖掘。

参考文献:

[1] 王鹏. 云计算的关键技术与应用实例[M]. 北京: 人民邮电出版社,2010.1,74-75.

篇5

【关键词】浅议;交通运输;企业;营改增;会计核算;变化

2013年8月1日随着交通运输企业“营改增”的全面推开,作为企业经济管理重要组成部分的会计也应相应跟进,在会计核算上做出相应变化,以便更好地为企业经营管理服务。为便于交通运输企业在“营改增”后对经济业务进行正确核算,在此以“营改增”后普通货运企业为例,从原始凭证取得、账簿设置、记账凭证、会计报表的编制几个方面对会计核算的变化进行探讨。

1 交通运输企业“营改增”后的分类和适用税率

交通运输企业“营改增”后,根据其营业收入规模和会计核算等方面的情况分为一般纳税人和小规模纳税人,一般纳税人适用11%的增值税税率,小规模纳税人适用3%的征收率,由于小规模纳税人在“营改增”前后会计核算变化不大,下面主要以一般纳税人为例对交通运输企业“营改增”前后会计核算的变化进行探讨。

2 交通运输企业营改增前后原始凭证、会计账簿设置上的变化

2.1 交通运输企业开具货运发票的变化

在营改增前,企业为客户开出的是从地税部门领取的普通货运发票,运费是含税价;在营改增后,企业为客户开出的是从国税部门领取的货物运输普通增值税专用发票,运费为不含税价。

2.2 交通运输企业取得购货或修理修配发票的变化

交通运输企业在营改增前,购买汽、柴油等货物或接受修理、修配劳务,取得的发票为普通货物销售发票或增值税专用发票,以发票列明的价款或列明的价税合计计入成本,增值税专用发票列明的税款不允许抵扣。交通运输企业在营改增后,购买汽、柴油等货物或接受修车劳务,取得的发票必须为增值税专用发票,以发票列明的价款计入成本,增值税款计入进项税额,其发票抵扣联经税务局认证后允许抵扣销项税额,否则,如为取得的发票为普通发票,则不允许抵扣销项税,企业就会遭受损失。

2.3 交通运输企业营改增前后会计账簿设置上的变化

企业在营改增前,在流转税账簿设置上只在“应交税金”科目下设置“应交营业税”一个三栏式明细账簿,用于核算流转税;营改增后企业应在“应交税金”科目下设置设置一个三栏式“未交增值税”明细账,和一个以“进项税额”、“销项税额”、“已交增值税”、“转出已交增值税”“转出未交增值税”为专栏的“应交增值税”多栏式明细账对流转税进行核算。

3 营改增前后企业账务处理的变化

3.1 营改增前后企业对流转税账务处理的变化

(1)营改增前企业对流转税的核算,营改增前企业在月度终了按本月营业收入和税率计算应纳的营业税,并进行账务处理,会计分录为:“借:营业税金及附加,贷:应交税金-应交营业税”。

例如:路通运输公司2013年8月份的营业收入为200万元,月底计提营业税:200万元x3%=6万元。会计分录为:

借:营业税金及附加 60,000.00

贷:应交税金-应交营业税 60,000.00

(2)营改增后企业对流转税的核算,营改增后企业对增值税的核算,企业在开具增值税专用发票后,根据实际结算情况,“借:现金(银行存款、应收账款),贷:营业收入、应交税金-应交增值税(销项税额)”。月底不再提取税金,应根据本月“应交税金-未交增值税”明细账的余额确定本月应补退的增值税税额。

例如:路通运输公司2013年8月份开具增值税专用发票注明的运费为200万元,增值税税额22万元,以银行存款收取。

借:银行存款 2,220,000.00

贷:营业收入 2,000,000.00

应交税金-应交增值税(销项税额) 220,000.00

企业预缴增值税时“借:应交税金-应交增值税(已缴增值税),贷:银行存款。”,接上例,企业在8月16日预交上半月的增值税10万元。

借:应交税金-应交增值税(已缴增值税)100,000.00

贷:银行存款 100,000.00

月底企业转出已交增值税,和未交增值税。

借:应交税金-未交增值税 100,000.00

贷:应交税金-应交增值税(转出已缴增值税)100,000.00

经计算月底企业未交增值税为5万元。

借:应交税金-应交增值税(转出未缴增值税)50,000.00

贷:应交税金-未交增值税 50,000.00

“应交税金-未交增值税”期末余额则为企业本月应补(退)的增值税税额。

3.2 企业购进固定资产在会计核算上的变化

(1)营改增前企业购进固定资产,购入固定资产时,如取得普通发票,则以发票注明的金额计入固定资产成本;如取得增值税专用发票,则以发票注明的价、税合计金额计入固定资产成本。用以核算固定资产。

例如:路通运输公司7月份购入普通货车1辆,取得的普通发票上注明的价款为23.4万元;购入半挂车1辆,取得的增值税专用发票上注明的价款为30万元、增值税额5.1万元。货款由银行支付。其会计核算为:

借:固定资产-普通货车 234,000.00

-半挂车 351,000.00

贷:银行存款 585,000.00

(2)营改增后企业购进固定资产,购入固定资产时,如取得普通发票,则以发票注明的金额计入固定资产成本;如取得增值税专用发票,则以发票记载的价款计入固定资产成本,发票记载的税金计入“应交税金-应交增值税(进项税额)”,用以核算固定资产。如上例,如企业在8月份购入上例所属车辆,则会计核算变为:

借:固定资产-普通货车 200,000.00

-半挂车 300,000.00

应交税金-应交增值税(进项税额) 85,000.00

贷:银行存款 585,000.00

4 营改增前后企业会计报表反映的变化

4.1 营改增前后资产负债表相关项目反映内容的变化

营改增前后资产负债表反映内容的变化不大,只是应交税费项目在营改增前反映的是营业税等相关税费,营改增后反映的是增值税等相关税费。

4.2 营改增前后利润表相关项目反映内容的变化

营改增后,利润表主营业务收入反映的是不含税收入,营改增前反映的是含税收入;营改增后,营业税金及附加项目反映的税金是除增值税之外的相关税费,营改增前反映的是含营业税等相关税费;营改增后,营业成本项目反映的是不含税成本,营改增前反映的是含税成本。

4.3 营改增前后现金流量表相关项目反映内容的变化

(1)现金流量表“销售货物或提供劳务收到的现金”项目,营改增前是反映的主营业务收入中收到的现金及现金等价物的金额;营改增后不仅反映主营业务收入中收到的现金及现金等价物的金额,还应反映和主营业务收入一同收到的增值税销项税额。

例如:7月份路通运输公司通过银行收到A公司汇来的运费50万元,在编制现金流量表的调整分录为:

借:销售货物或提供劳务收到的现金 500,000.00

贷:主营业务收入 500,000.00

8月份路通运输公司通过银行收到A公司汇来的运费50万元,增值税销项税5.5万元,在编制现金流量表的调整分录为:

借:销售货物或提供劳务收到的现金 555,000.00

贷:主营业务收入 500,000.00

应交税金-应交增值税(销项税) 55,000.00

(2)现金流量表“购买商品或接受劳务支付的现金”项目,营改增前是反映的主营业务成本中购买商品或接受劳务支付的现金及现金等价物的金额;营改增后不仅反映主营业务成本中购买商品或接受劳务支付的现金及现金等价物的金额,还应反映和主营业务成本中购买商品或接受劳务支付的现金及现金等价物的金额一同支付的增值税进项税额的金额。

例如:7月份路通运输公司通过银行支付B石化公司柴油款30万元,在编制现金流量表的调整分录为:

借:主营业务成本 300,000.00

贷:购买商品或接受劳务支付的现金 300,000.00

8月份路通运输公司通过银行支付B石化公司发票载明柴油款30万元,增值税5.1万元的柴油款项,在编制现金流量表的调整分录为:

借:主营业务成本 300,000.00

应交税金-应交增值税(销项税) 51,000.00

贷:购买商品或接受劳务支付的现金 351,000.00

(3)支付的与经营活动有关的现金项目,营改增前是反映管理费用、营业费用等账户中购买商品或接受劳务支付的现金及现金等价物的金额;营改增后不仅反映管理费用、营业费用等账户中购买商品或接受劳务支付的现金及现金等价物的金额,还应反映和管理费用、营业费用等账户购买商品或接受劳务支付的现金及现金等价物的金额一同支付的增值税进项税额的金额。

例如:7月份路通运输公司用现金购买办公用品一批,发票载明的金额1500元,在编制现金流量表的调整分录为:

借:管理费用 1,500.00

贷:支付的与经营活动有关的现金 1,500.00

8月份路通运输公司用现金购买办公用品一批,发票载明的货款1000元,增值税170元。在编制现金流量表的调整分录为:

借:管理费用 1,000.00

应交税金-应交增值税(销项税) 170.00

贷:支付的与经营活动有关的现金 1,170.00

综上所述,交通运输企业“营改增”前后在会计核算上的变化,主要是原始凭证、账簿设置、账务处理和会计报表项目反映内容上的变化,理清这些变化,并掌握这些变化对我们在会计核算上的影响,我们就能真实、客观的反映企业营改增后的财务状况、经营成果和现金流量。

【参考文献】