发布时间:2023-10-09 17:40:44
序言:作为思想的载体和知识的探索者,写作是一种独特的艺术,我们为您准备了不同风格的5篇经济数据展示,期待它们能激发您的灵感。
那么,新人站长怎样才能收集哪到自己想要的数据来进行分析呢?下面谈谈我在收集数据方面的一点心得:
问题一:怎么收集符合要求的数据
我在收集符合要求的站点时采用以下方法:
1、 蜘蛛查找法
1):首先,先去导航网站找到相关的站点,一个一个的查找符合要求的;
2):其次,在查找到符合要求的站点中,从他们的友情链接中再次寻找符合要求的站点;
3 ):最后,在第二次符合要求的站点中继续上面的方法。
注:前提是在浏览器中装ALEXA统计插件。(以多少ALEXA排名为收集目标 )
2、门户站点子频道
为什么去门户站点的子频道寻找目标呢?因为,门户站点的子频道友链质量很高,符合要求的站点也有许多。这样就 为下一步分析节省了的很多时间。
3、站点联盟
每个行业站点都有自己的联盟站群。找到与自己站点相关的联盟站群网站来收集数据也是个不错的方法。
总结:
1):以上是我做数据收集的三种方法,虽然很费事可减少了重复率的发生。
2):数据收集的过程是很枯 燥的,关键在于坚持及有较强的执行力。
问题二、如何分析收集到的站点
想要的数据已经收集完毕了,那接下来的工作就是对所收集的站点进行分析啦。下面由段轩来讲解分析一个站点需要 什么数据作为参考:
首先,我转换角度想:如果自己是站长寻找友情链接需要什么数据作为参考。
其次,如何把这些数据做精做好,让看数据的人一看就明白是怎么回事。
设想:如果我做友情链接的话会需要以下几种数据作为参考:
ALEXA排名、谷歌PR值、百度权重、雅虎外链、百度快照、百度/谷歌收录量、PR输出值、关键词密度、域名注册信息、日均访问量。如图:
总结:只有确定了自己以哪个角度来看待收集到的数据,并想从这些数据中得到哪些有用的数据,才能在分析数据时游刃有余的提炼出有价值的信息。切 记:换位思考是分析数据的第一要素。
问题三、如何提炼有价值数据?
经过初步收集的数据来看,我觉得在排版上还是不够让人一眼就能看出来哪些是有价值哪些是没有价值的。因为我一开始收集数据时是以网站名称字数来排序的,如图:
后来我按照网站ALEXA排名高低来排序,只有表格美观了才能让人读懂表中所要体现的数据价值。如图:
图解:相比第一张报表改进后的报表一眼就能让人看出来网站的排名情况,其他分析项目自然而然的就一目了然了。
关键词:
1.引言
在数字油田总体框架设计中,中间部分是中心数据层。本文阐述的主要对象是中心数据层中的“地质录井库”(简称“录井库”),是中心数据库之一,它的建设是在目前优先建设数字油田规划中勘探主营业务部分的战略思路的指导下进行的。
2.录井库建设方针的形成
任何项目的建设都需要有一个方针,有一个方向性的指向,录井库的建设当然也不例外。要进行数字油田建设,数据库作为现代信息的载体和基础是必须建设的,首先需要研究怎么样来建好这个录井库,为此展开库建设方针的探索。
2.1数据模型
数据模型是一个可用于描述数据库结构的概念集合,类似于军事中的战场沙盘和勘探开发中的三维地质模型,都是现实的缩影。
从产生过程可以总结出数据模型是现实世界经过三层抽象而形成的,具有逻辑和物理独立性的特点。例如:对于样品分析,现实世界是从取样到出分析结果的全过程,经过视图抽象,形成各个分析项目的报表视图,再经过概念抽象,找出各种分析项目之间的共同点,都需要取样、需要分析、需要得出指标数据,并且理清存在的流程关系,最后经过物理抽象形成物理模型进而按照他们之间的关系在数据库中建立取样数据表,分析数据表,指标数据表这些逻辑对象,当然更深层次的是物理模型已经将这些对象对磁盘、内存等硬件资源的分配也做好了设计。因此要建设好录井库,就要画好数据模型这张图纸。对于模型的研究就是对于主库结构的研究。
2.2石油数据模型发展简史
中石油数据模型的发展划分为三代,第一代是勘探、开发、钻井数据库逻辑模型,第二代是勘探开发核心逻辑模型,第三代是伴随着信息规划A字头项目产生的PCEDM核心模型。这三代模型在中石油信息发展史上都有着一定的作用。第一代模型实现了从无到有的转变,但是随着业务需要的发展,他不能满足勘探开发一体化的需求;接踵而来的第二代数据模型,在业务涵盖程度上有了很大的提升,可以说非常贴合油田业务实际,但是还是没有实现勘探开发一体化;而2008年产生的PCEDM直接在实体模型的设计上就解决了勘探开发一体化,并且能够描述新生的分支井、及水平井业务。
信息规划中油气田勘探录井(即正在使用的A01、A02、A07系统)使用PCEDM模型,其直接相关部分的6个系统,使用PCEDM模型或者使用与PCEDM之间的具备完美接口的模型体系。同时PCEDM作为模型标准在今年将要出版。
在A01、A02项目应用过程中,可以认识到,PCEDM具有强整体性、高适应性、可扩展性、符合油田业务发展需要的发展中的石油数据模型。同时这也是录井库建设方针产生的主要原因。
2.3录井库建设方针分析
按照数字油田规划的整体安排和部署思路,录井库在油田总的中心主库搭建平台下,选择以PCEDM为基础,并按照业务需要进行扩展而形成的,保持了主库三方面的优势,分别体现在业务管理、信息管理和部署方式的战略意义上。
勘探开发协同研究是目前油田业务发展的趋势。按照斯伦贝谢公司提出的信息建设架构,勘探开发协同研究是建立在由地理信息导航平台所支撑的数据管理平台之上的,而数据管理平台又是由专业库和项目库通过一次集成产生的一体化集成平台所支撑的。在业务管理上涵盖地质录井生产等各个环节,建立统一有机的联系。形成多个专业库分支的集成,在大部分专业上替代了一次集成的过程。 在信息管理方面,录井库是一个按照面向对象的理论整体设计,模块化使用的模型,具有强整体性、高适应性、可扩展性。正因为这样的性质,我们能够根据各个专业的细节在不改变模型核心(Core)的基础上进行扩展建设,从而形成电子LJPCEDM。LJCEDM架构符合数字油田建设中“起步晚,起点高”的战略思路。从目前中石油信息建设的趋势来看,A字头重点信息项目以PCEDM为主数据库,大庆、塔里木等数家油田将原有专业库向PCEDM数据库改造。直接选择以PCEDM为基础的LJPCEDM无疑是站在了高起点上。同时多专业整体性的PCEDM正是能够克服目前油田信息管理人员较少,分散建设专业库力量不足的困难,能够使用较少的资源实现数字油田勘探开发主营业务的初步支撑。
3. 录井库建设规划
录井库建设的思路是以A01、A02数据库原型为基础,参考PCEDM相关模型资料,借助PowerDesigner、PL/SQL、Access、Visual Studio等研究工具,以专业数据正常化研究和资源建设贯穿整个库建设过程,通过搭建录井库模型研讨平台,展开对PCEDM这个面向对象的概念模型的深层认识和扩充建设工作。
地质录井库建设的目标:全面支撑数字油田在勘探开发结构化数据方面的存储、管理和应用的数据库,在此基础上,将库的体系扩展到数字油田的各个领域。
地质录井库的架构设计上,采用LJPCEDM为核心数据管理层,PCDM2002作为应用层紧密包裹在LJPCEDM的周围,并以此更好的支持原有勘探开发系统,支持正常化采集和勘探开发研究项目环境进而支撑核心目标。
为了实现这个架构,完成我们的设想,达到核心目标。需要把录井库建设的工作拆解开来分步四步实施:
* 第一步,建设LJPCEDM原型
* 第二步,伴随建设优化模型
* 第三步,建设业务应用层
* 第四步,建设主库技术知识网
目前第一步已经顺利完成,第二步建设正在进行,第三步和第四步都处与设计阶段。后面三步工作在技术力量允许的情况下可以交叉进行。
对于已经建设完成的LJPCEDM原型,要做三方面的工作,分别是模型信息统计、A01、A02数据整合和PCEDM模型扩充方法研究。其中用到了众多Oracle的技术,如数据字典信息应用、递归查询运用、触发器运用等等。第一步虽然已经完成,但是通过了近期数据库技术的深入学习发现A01、A02同步得来的LJPCEDM原型还有很过需要完善的部分。例如A02数据同步至主库可以使用快照同步技术从而提高主库数据的时效性和准确性。从这点上来看,库的建设是一个不断完善的过程。
正在进行的第二步建设有一条非常明确的中轴线,那就是伴随数据正常化和资源建设的过程建设符合主营业务要求的LJPCEDM。优化扩充建设的原因主要包括:相对业务缺失模块、原设计存在漏洞、缺少关键信息字段、部分字段类型不符等方面。
第三步建设工作主要是进行业务应用层设计,按照四个步骤进行:
首先在资源建设的过程中,按照PCDM2002的标准进行数据 收集和整理工作,其次在数据正常化的过程中,按照PCDM2002的标准进行数据采集的规范和相关报表的统一,然后在现行的应用项目的实施过程中保留符合PCDM2002标准的中间视图,最后实施以PCDM2002为标准的主库应用层主题项目。在这样的安排下实现业务应用层“总体设计,分步渗透,集中建设,全面支持高速应用”的目标。
第四步建设库技术知识网是建立在前面提到的库模型研讨建设平台之上的,主要设计功能有三个。一是满足主库结构动态,二是研发出能够使用的库管理平台,三是提供一个各级业务专家能够提出业务需求和参与建设意见的讨论平台。我们的库运维团队和各级业务专家在这个平台上扮演各自的角色,共同构筑主库技术知识网络,最终达到更好的推进和完善数字油田应用的目标。
4. 录井库建设工作阶段分析
录井库建设工作到目前虽然刚刚启步,但是我们取得了一系列突破性的研究成果。
4.1思想认识提升
第一点表现是:认清了主库与分库建设与数据正常化和资源建设的关系。正常化建设的方法概括的讲就是通过对数据源点的调研了解和掌握新数据从产生到归档的整个流程,同时分析和对比同类报表,最终建设好数据层依附与LJPCEDM的客户端和行业通用报表的过程。资源建设的方法概括的讲就是通过对数据源点进行详细的数据收集、整理、审核等一系列规范化操作,最终将数据资源迁移加载至LJPCEDM的过程。我们不难发现,无论是正常化建设还是资源建设最后都是要建立在LJPCEDM之上的,即主库是正常化和资源建设成果实体构成的核心。当然正常化和资源建设都能推进主库模型朝着更符合业务管理需求的方向发展。因此主库和分库的建设与正常化建设的关系是相互促进、互为保障;与资源建设的关系是规范建设,共同推进。
第二点表现是:认清了数据管理和业务管理的关系。在这近一阶段的数据迁移工作中,通过一些典型的实例讨论我们逐渐认识到主库不只是数据的载体,同时还是数据的管理工具,更是业务管理思路的集中抽象体现。为此数据管理和业务管理之间应该是相互促进共同进步的,业务管理的先进经验要及时的体现到数据模型设计中,同时先进的数据管理模型也应该推广至业务管理中。
4.2库原型形成
为了能够更好的控制设计思路与物理实现的一致性,第一步就是要精确的统计数据库中各表的数据量和确定各表主外键关系。为了得到这些信息,引入了系统视图信息循环运用的办法和递归查询的灵活运用。
ORACLE10中存在着41000多个用于记录系统信息的数据字典,其中就包括用于记录数据库中用户数据表信息的USER_TABLES和记录主外键信息的USER_CONSTRAINTS和主外键字段信息的USER_CONS_COLUMNS,灵活的运用这些数据字典中的信息我们能够快速的统计出一个数据表的使用情况和模型的结构。
通过统计监控确保数据库的逻辑结构跟设计思路的一致性。为库原型的形成提供了技术保障。
4.3建设方法论
笛卡儿在《方法论》(Discours de la méthode)中指出,研究问题的方法分四个步骤,我们按照这四个步骤也总结出了LJPCEDM建设方法的四个方面:
第一个步骤:永远不接受任何我自己不清楚的真理,只要没有经过自己切身体会的问题,不管有什么权威的结论,都可以怀疑。这一点告诉在建设LJPCEDM的过程中任何单位和个人关于PCEDM的理论都可以怀疑,只有实际存储并能良好应用的结构才可信。
第二个步骤:可以将要研究的复杂问题,尽量分解为多个比较简单的小问题,一个一个地分开解决。因此LJPCEDM的建设要按照专业的划分,逐个进行研究,理清生产实际中的各类关系,以便更好的抽象出物理模型。
第三个步骤:将这些小问题从简单到复杂排列,先从容易解决的问题着手。因此LJPCEDM研究专业的顺序要按照油田建设总体规划进行,先易后难,“急用先建,以用促建”。
第四个步骤:将所有问题解决后,再综合起来检验,看是否完全,是否将问题彻底解决了。因此在建设完成后我们应该从综合应用上整体评价LJPCEDM的建设效果。
综上所述,总结出了在批判的接受现有PCEDM模型理论的基础上,按照数字油田总体建设规划先易后难、“急用先建、以用促建”的要求分专业精细研究扩展建设,最终以能否良好的服务应用为唯一检验标准的LJPCEDM建设方法。
4.4扩展建设实践
截止目前,已经在野外、综合录井、气测、地层岩性、油气显示、探井生产井、新技术等几个方面按照LJPCEDM建设方法展开了扩展建设的实验性实践,围绕地质录井主库建设要做好四项工作。
(1)继续完善PCEDM到LJPCEDM的转化工作,努力建设一整套覆盖录井专业的特色主库模型结构
相关专业的数据和分析化验等专业数据模型的完善建设需要紧密结合数据正常化和资源建设的步伐开展研究扩展工作。预计在下一段时期催涉及专业覆盖面上与数据正常化建设同步完成LJPCEDM的构建,从而保证数据正常化和资源建设成果的保存。
(2)基于Oracle Spatial技术的空间数据库扩展
关键词 竞技体育 大数据 机遇 挑战
中图分类号:G811 文献标识码:A
数据,一直以来都是体育科研工作者所关注的热点问题。近年来,伴随着信息时代的数据大爆炸,大数据这一概念应运而生。它的出现不仅仅意味着技术的发展,甚至推动了时代的变革。大数据时代,数据将充斥着社会的各个领域,而体育从某种角度来看就是一个数据的集合,因此对科学研究来说,体育无疑是合适的大数据试验场。然而一直以来,我国竞技体育领域数据的相关工作发展都不甚理想。面对即将来临的大数据时代,中国竞技体育应当总结、学习国外相关领域发展的先进经验,顺应时代潮流的变动,主动探索这一新生的领域。在新的时代中,探索出一条符合自身特点的可持续发展道路。
1大数据与竞技体育
大数据时代,通过物联网、云计算等新的大数据技术方式的应用,能够使原来分散的竞技体育资源可以在竞技体育系统内部高效配置,从而大大改进竞技体育管理与决策方式,并进一步提高竞技体育信息化、现代化水平。在竞技体育领域,大数据的作用主要表现在数据挖掘和数据可视化上。
1.1数据挖掘与竞技体育
数据挖掘技术,能为职业体育俱乐部提供更多、更全面的球员评估指标、比赛分析指标。通过在数据和运动员表现之间建立模型,帮助体育俱乐部在选择运动员之前就能很好的了解运动员的现有运动水平和预测发展潜力;帮助体育俱乐部对现有运动员的运动水平有客观的认识,并配置相应的训练计划。例如美式橄榄球联盟(NFL)运用生物传感技术、数据挖掘技术对参加选秀的大学球员进行评估,以选拔出有潜力的运动员;美国职业棒球大联盟(MLB)的球队奥克兰运动家俱乐部,通过数据分析法在联盟中率先采用上垒率这一指标来寻找和考核球员,而数据分析则帮助奥克兰运动家队成为了美国职业棒球史上首支取得20连胜的队伍,帮助球队焕发第二春。这一案例在美国职业棒球领域引发轰动,各大俱乐部纷纷开始雇用专职的数据分析员。
1.2数据可视化与竞技体育
数据可视化往往是数据挖掘之后的产物,与数据挖掘密不可分,专业的数据公司在将数据挖掘与数据可视化结合这一方面往往做得更好。IBM公司追踪了四大满贯赛事八年来的全部8128场比赛,收集了4100万个数据,为每一个大满贯选手模拟了一个对比数据库。基于这一数据库,IBM推出了Slam Tracker系统,这一系统能够能针对性地为比赛选手提供最优战术,为观众提供着更为直观生动的观赛体验,并且帮助观众更加准确的感知比赛过程。
2大数据时代竞技体育的机遇与挑战
伴随着技术的不断革新,竞技体育领域收集到的数据量越来越大、数据采集速度越来越快;数据类别越来越多、数据越来越准确,这无疑为竞技体育带来了机遇与挑战。
2.1大数据时代竞技体育的机遇
美国职业篮球联盟(NBA)无疑顺应时代潮流、抓住机遇的典型案例。就数据获取而言,NBA联盟的各支球队广泛应用SportVU技术,在每座球馆的上空会悬挂着6个超高清摄像头,每秒钟能够抓取25帧图片。这些摄像头采集到的数据通过复杂的计算公式与比赛的play-by-play数据同步,能够在90秒内便发回报告。每个球员的每个动作、每次传球、每次投篮、每次触球……一切的一切都被记录了下来。
就数据的挖掘而言,通过SportVU追踪系统,有研究者成功建立量化防守表现的数学模型,并将其可视化。他们通过计算防守的对位和时间,最终得到了一系列量化指标,防守能力的量化的能够让人们能够更加清晰地了解一名球员的价值。面对大数据时代NBA采取的是开放的态度,积极引入能带来变革的技术,对各支球队而言海量的数据就是无穷的宝库,顺应潮流并选用合适的数据挖掘方案就能在这座宝藏中获得珍宝。
2.2大数据时代竞技体育的挑战
数据科学在某些竞技体育项目上的运用,并不能代表大数据在竞技体育系统的广泛运用。以足球运动为例,相比数据分析在橄榄球、棒球、篮球等项目广受追捧,数据分析足球项目明显“遇冷”。足球运动的数据收集进展远远落后于其他运动,借助技术的发展,近年来涌现出一批网站,这些网站将比赛的数据统计结果更好的展现给了观众。通过网站提供的信息让你可以知道哪个球员一场比赛乃至一个赛季的各项统计数据,还有一些类似热点图和传球线路图等的图片方式更好的呈现这些数据。然而这些数据也仅仅只是数据而已,如何对这些数据进行挖掘,如何通过数据建立模型进而能对关键能力进行量化是亟待解决的问题。
目前我国体育数据统计主要由国家主导、体育院校、运动队参与,展现出一个自下而上汇总数据的过程。国家统计局的相关体育统计数据主要表现了我国体育的宏观数据,而各个体育院校和运动队的数据具有一定偏向性,用于研究的数据样本规模、代表性能否能适应大数据时代数据依旧存疑;我国竞技体育领域的信息化水平较低,数据的收集与存储手段相对原始,与国外先进水平相差较大,数据挖掘专业的人才缺口巨大。据相关报道,中超球队江苏舜天队的数据分析,其实只是人工统计的简单记录,包括犯规、越位、射门、抢截等等基本信息。然而在数据科学应用较晚的足球领域,专业的数据公司已经可以依据体育场内安装8个角度不同的热成像功能摄像机,获得全场画面、所有球员的跑动路线,后续便可生成跑动距离等数据,或者对照比赛视频分析定义球员与动作。
同时大数据本身也存在一定的问题,数据不懂社交。大脑在数学方面很差劲,但是大脑懂得社会认知。人们擅长反射彼此的情绪状态,擅长侦测出不合作的行为,擅长用情绪为事物赋予价值。数据不懂背景。人类的决策不是离散的事件,而是镶嵌在时间序列和背景之中的。经过数百万年的演化,人脑已经变得善于处理这样的现实。人们擅长讲述交织了多重原因和多重背景的故事。数据偏爱潮流,忽视杰作。当大量个体对某种产品迅速产生兴趣时,数据分析可以敏锐地侦测到这种趋势。但是,一些重要的产品在一开始就被数据摈弃了,仅仅因为它们的特异之处不为人所熟知。然而对于竞技体育而言,一些运动员杰出的表现正是通过一些特异的数据展现。
通过计算机,我们可以快速、准确的提取数据、进行数据分析。然而在某些方面机器却没有办法取代人。计算机在目前的技术水平下尚不能识别某些精确动作和动作背后的情感、认知因素,仍然存在大量需要人来解释的信息,设想一下在某年的夏季转会窗口,一个球队的球探想要为球队物色一名出色的球员,两名上赛季表现平平的球员摆在球探面前,如果球探仅仅观看了两名球员的赛场表现,而没有去研究他们的统计数据,那么他很有可能建议球队谁都不要买;如果他仅仅查看了球员的比赛数据,而没有去现场观看他们比赛,他可能就会建议球队买下其中一名。然而正确的结论往往是将传统的比赛侦查和对球员的数据分析两者相结合起来,另外一名球员可能才是更好的那一个。
3相关建议
针对大数据时代竞技体育系统存在的挑战:
首先应当解决的问题是建立顺应大数据时展的竞技体育数据收集与共享平台,强化各个体育院校和运动队之间的数据共享,体育主管机构通过对数据的汇总与收集建立数据库、云平台,实现对数据的良性反馈,进而助力体育科研。同时依据具体运动具体分析,制定适应具体运动项目的数据收集与挖掘方案。
其次,应当大力推动数据科学在竞技体育领域的运用,加大投入,着力提高我国竞技体育领域的信息化水平,培养一大批体育数据科学人才。也可以参考国外先进经验,委托或者建立专业的体育数据公司进行数据收集和挖掘工作。
注释
[1] 维克托・迈尔・舍恩伯格.大数据时代[M].浙江人民出版社,2013.
一、反贪侦查中电子数据的常见类型及技术方法
学界对于电子数据的讨论由来已久,对其定义和界定并没有统一的定论。一般而言,所谓“电子数据”即电子形式的数据信息,强调的是记录数据的方式而非内容。而以电子数据为基础的各种存在形式可以统称为电子证据。电子数据是各类电子证据的本质,是各种外在表现形式的内在属性和共同特征。电子证据在本质上是电子数据,其外在表现形式具有多样性、不确定性且易于更改。
(一)电子数据的常见类型
在侦查工作中常见的电子数据类型主要有以下几种:
1.文字处理文件。即通过文字处理系统形成的文件,由文字、标点、表格、各种符号或其他编码文本组成。不同类型的文字处理软件生成的文件不能兼容(如Word和WPS),使用不同代码规则形成的文件也不能直接读取。所有这些软件、系统、代码连同文本内容一起,构成了字处理文件的基本要素。随着信息化和无纸化办公的不断推进,Office、WPS等文档,word文档、excel表格等已经逐渐取代过去的纸质文件成为个人或单位记录信息的主要方式,这类office、WPS等文档已成为反贪侦查工作的重点关注对象,浙江省反贪部门查办案件中,已经有通过电子数据技术,恢复已删除的计算机word文档,为案件侦查提供证据材料的成功案例。
2.图形处理文件。即由计算机专门的软件系统辅助设计或辅助制造的图形数据,通过图形人们可以直观地了解非连续性数据间的关系,使得复杂的信息变得生动明晰。办案中较为常见的图形处理文件包括相片、录音和录像等。需要注意的是,新刑诉法规定的第八种证据包括视听资料和电子数据,这种设置就是因为这两种证据之间存在相互关联、相互交叉的地方,所以将二者归为同一的证据种类。常见的图形处理文件如手机信息、电子邮件、即时通讯信息、录音录像等。特别是智能手机、电脑以及网络的普及,利用手机、电脑等工具追溯相关案件信息已成为浙江省反贪办案的常见方法。如浙江省某区院在查办行贿人王某时,通过查看其手机,发现了受贿人周某与其短信频繁,并有银行账户资金往来的短信提醒,该类信息的获取为侦查指明了方向,为深挖窝串案奠定了良好基础。
3.数据库文件。即由若干原始数据记录所组成的文件。数据库系统的功能是输入和存储数据、查询记录以及按照指令输出结果,它具有很高的信息价值,但只有经过整理汇总之后,才具有实际的用途和价值。办案中常见的数据库文件多为电子账目。由于贪污和渎职类犯罪大多会涉及到单位的账目,而现在的单位又大多都采用电子记账,因此电子账目是常会接触到的电子数据表现形式之一,主要包括包含账目内容的电子表格和由账目管理软件生成的电子账簿等。
(二)获取电子数据的常用技术方法
1.电子数据的复制技术。指从待鉴定的设备中把电子数据复制出来,以固定证据数据,并保证这个证据数据的原始性和证据数据的完整性。待鉴定设备是指存储、处理或者传输二进制数据的设备,包括计算机、通信设备、网络设备、电子数据存储设备等。该技术主要涉及到各种设备中存储数据的写保护技术、主比特的数据复制技术、可信值的校验技术和数据擦除技术。实践中,在搜查犯罪嫌疑人办公室和家庭时,遇有不能轻易挪动的电子设备时,侦查人员通常采用该种技术进行取证固定,确保相关信息的不遗失。
2.删除数据恢复技术。是对电子数据中被删除、覆盖、损害或者加密的文件进行还原恢复。主要涉及有文件系统级的恢复技术,如系统崩溃后恢复里面的证据文件,系统文件应用级的恢复技术,数据库的恢复文件以及错误文件修复技术和加密文档的破解技术。办案中比较多运用的是对手机信息的恢复,如浙江某区院在查办受贿人张某时,通过扣押其手机发现其手机短信中有不少有价值的内容,但犯罪嫌疑人的反侦查意识很强,仅保留一两天的短信,而通信运营商一般仅能查询一个月内的短信,侦查人员便与技术部门合作,对张某的手机短信进行恢复,从已删除的短信中获取了大量侦查信息,为侦查取证和审讯突破奠定基础。此外,对电脑删除信息的恢复逐渐成为办案人员掌握犯罪嫌疑人性格特征、成长规律、生活习惯的重要方式方法,著名的港台明星陈冠希“艳照门”事件中的艳照即来自于电脑已删除信息的恢复,虽然陈冠希已删除了这些照片,但有人使用恢复技术恢复了这些信息并传播至网上,从而造成了恶劣影响。
3.数据搜索分析技术。指在繁复的数据中搜索特定的信息加以关联,并进行有效分析。如文件属性分析,文件的数字摘要分析,日志分析等等。主要涉及对于文本信息的搜索关联技术和图像、音频、视频内容的识别技术和海量数据的分析技术,从中查找对侦查有帮助的信息。比如公安部在查办马加爵案件中,办案人员对马加爵经常使用的电脑进行分析,发现在案发前后,马加爵曾大量浏览一些省市的人文、地理信息,办案人员通过数据搜索技术进行分析,发现马加爵对海南的地理、人文信息浏览频率最高,公安部随即将办案重点转至海南,并在其他技术的配合下在海南将马加爵抓获。
4.手机话单分析技术。指根据侦查工作对话单分析的实际需求,借助统计学、数学集合等相关理论和谷歌卫星地图的服务支撑,通过逻辑组合计算,按事先设定条件,对大量的通话数据进行程序处理,实现重要数据筛选、统计图表生成、可疑号码排查、新启用号码快速锁定和历史通话轨迹的可视化显示等功能。浙江温州市院已于2009年自主开发了手机话单分析系统,该系统具有话单数据自动导入、历史通话位置查询、历史通话轨迹可视化显示、新号码自动搜索、关系分析、身份比对、统计分析等多项功能,只要掌握了涉案对象的手机号码,就可以通过该系统准确获取涉案对象的关系圈、生活规律、活动轨迹等信息,为抓捕对象、辅助审讯提供助力。目前该系统推广至浙江各市院,并在反贪办案中发挥了显著效用,为节省办案资源、提高侦查效率提供了强大助力。
二、反贪侦查中运用电子数据的工作现状
浙江省检察系统一直以来都高度重视电子数据技术工作,并确定省院反贪局、反渎局、技术处三个部门为主要责任部门,扎实推进电子数据技术工作,逐步形成集基础系统、应用系统和管理系统为一体的职务犯罪侦查技术支撑体系。2010年以来全省累计完成各类电子数据技术支持170余件次,主要有计算机硬盘数据恢复、手机通讯录与短信恢复、网络数据搜索与恢复、数字图像比对等四类,取得了一定的工作成效。今年3月,省院反贪局、反渎局和技术处联合下发了《关于加强职务犯罪侦查中电子数据等技术应用的通知》,对电子数据技术工作进行了具体部署。经过多年的努力,浙江省侦查办案使用电子数据取得了长足进步,逐步迈上了规范化的正轨,有力推动了侦查科技化、侦查现代化的进程。但不可否认的是,与公安、安全等运用成熟的部门相比,反贪侦查运用电子数据还处于初级阶段,办案实践中还存有不少问题亟待解决:
(一)对电子数据的思想认识需进一步提高。侦查人员受传统证据观念的影响,对于电子数据这一新型证据形式缺乏理性的认识,对电子数据检验鉴定技术缺乏必要的了解,对电子数据的获取和鉴定程序尤其缺乏应有的重视。这一方面与电子数据提取与鉴定技术尚不完善有关,但另一方面也与基层反贪干警的应用意识不强,对电子数据的重要性认识不够密切关联。部分基层反贪部门的领导甚至片面地认为这是技术部门一家的事情,侦查人员只需提供扣押的物品即可。随着信息化的不断深入,电子数据将越来越多出现在侦查办案与调查取证中,对电子数据的思想认识亟待提高。
(二)电子数据的取证流程与管理制度需进一步完善。电子数据具有高科技性、隐蔽性、易改性和形式多样性等特点,这就决定了电子数据的取证要兼具合法性和专业性,一方面对电子数据的取证必须要由侦查人员来主导,确保取证合法,另一方面电子数据的专业性决定了取证程序包括扣押、鉴定等必须由专业人员来实施,才能保证电子数据取证到位。目前,高检院虽然制定《人民检察院电子数据鉴定程序规则(试行)》,但对于电子数据勘验检查等技术环节均未制定相应的标准操作程序,各地实践的操作随意性大,一线干警在对犯罪嫌疑人进行搜查、扣押时,很少或甚至不邀请技术人员共同参与,他们往往遵循传统的搜查、扣押方法,这就可能使电子数据未能及时提取,或者破坏电子数据的完整性,最终影响到电子证据的效力。
(三)电子数据专业的技术力量需进一步加强。目前浙江省检察机关从事电子数据技术工作有资质的鉴定人和助理鉴定人仅有20名,专职技术人员很少,绝大多数检察院由信息技术人员兼职开展此项工作。信息技术人员虽然都具备计算机、网络技术等的专业背景,但对于电子数据的提取、检验鉴定缺乏相关的专业知识和实战经验,程序意识和证据意识也较为缺乏,对侦查工作更是一知半解,电子数据技术人员的业务能力和水平距离侦查办案的实际需求,尚需不断培训提高。同时,一线的侦查干警虽然掌握传统的办案模式,但熟悉电子数据技术并熟练掌握取证流程的寥寥无几,各地获取、鉴定和运用电子数据还处于较为初级的阶段。
(四)电子数据的取证能力和运用技巧需进一步提高。目前,侦查办案中运用较多的是手机话单分析系统,对公安机关运用成熟的如电子数据搜集技术、恢复技术、保全技术、数据时间检验分析技术、硬件逆向分析技术、电子邮件检验技术等技术还处于摸索阶段,一线干警运用电子数据服务于办案的能力还不强。如公安机关较为常见的电子数据恢复技术,一线反贪干警在搜查、扣押犯罪嫌疑人物品时,很少或甚至没有扣押手提电脑、台式电脑、移动硬盘等电子数据的存储介质的习惯,对电脑、手机恢复删除数据以服务于侦查取证更是少之又少。侦查干警对电子数据的取证能力与运用技巧远滞后于信息社会打击腐败的发展需要,亟待进一步提高。
(五)侦查部门与技术部门的配合需进一步密切。电子数据的取证有赖于侦查人员与技术人员的通力合作,但实践中,受制于部门壁垒、部门本位主义、主观认识不到位等因素的影响,基层反贪部门对邀请技术人员参与侦查的认识不够,日常协调、加强沟通、寻求支持的不多,更多的是在录音录像等常规工作上才求助于技术人员,邀请技术人员协助参与办案的不多。如电子数据的取证要求具备完整性、安全性和连续性,其收集、固定与获取不能在原始介质上进行,这就要求技术人员必须参与现场勘验、搜查、扣押等工作,确保数据完整、无误,而实践中搜查、扣押很少邀请技术人员的参与;再如侦查人员对技术部门的电子数据技术水平不了解、不掌握,一些有用的电子数据由于缺乏有效的配合往往遗失,影响了后续的侦查进程。侦查人员与技术人员的工作合力尚未形成。
三、加强电子数据取证工作的具体举措
(一)提高对电子数据技术工作的认识
新刑事诉讼法明确了电子数据的法律定位,两院三部颁布的《关于办理死刑案件审查判断证据若干问题的规定》规定了电子邮件、电子数据交换、网上聊天记录、网络博客、手机短信等电子证据的审查内容,对电子数据技术工作提出了新的更高要求,将对反贪工作的执法办案带来明显影响。一方面,电子数据丰富了证据种类,增加了证明犯罪事实的方法和途径,为促进侦查方式的转型拓宽了途径,另一方面也有利于促进反贪干警侦查水平的提高,引导侦查工作逐渐走上侦查现代化、信息化的道路。各地要进一步重视电子数据的重要性和可行性,切实提高在检察机关执法办案中应用电子数据技术的认识,以贯彻落实新刑事诉讼法为契机,认真抓好电子数据技术应用工作。
(二)规范电子数据技术在办案中的应用
无规矩不成方圆,电子数据应当依一定的程序和方法进行提取、固定和鉴定,以确保电子数据的真实性、完整性和有效性。目前高检院对电子数据各项技术工作程序规定尚未完善,建议有条件的地方出台电子数据技术工作规则,明确了电子数据的勘验、送检、鉴定、运用等应用流程,规范了电子数据的技术文书格式,以推动电子数据技术运用的委托手续齐全、办案人员与技术人员职责分明、操作程序公开透明。
(三)建立健全电子数据技术的应用协作机制
电子数据专业性强,开展难度高,需要多个部门之间的通力配合。反贪部门要主动加强与技术部门的协调配合,建立明确的应用协作机制,通过部门间联席会议、联络员、信息交流和情况通报等多种形式的信息共享机制,强化协作配合的一体化意识,形成工作合力;侦查人员尤其要树立主动应用电子数据技术手段的意识,特别是在大要案、窝串案和新领域、新类型案件中,积极寻求技术人员的技术支持,充分发挥专业人员的专业优势,把应用电子数据技术作为重要的侦查手段运用好、发挥好,为反贪办案提供新的助力。
在我国步入网络时代之后,商品与服务模式的交易发生了深刻的转变,网络交易日益频繁,利用网络交易模式既可以降低成本,还可以优化营销效果。网络经济凭借自身快捷、高效的优势,成为我国国民经济中的有机组成部分,逐步被社会大众所接受。本文主要针对大数据时代网络经济可持续发展模式进行分析。
关键词:
大数据时代;网络经济;可持续发展模式
随着社会经济的发展和互联网技术的进步,人们在互联网上的活动越来越多,这些活动产生了非常庞大的数据集,对这些数据集的科学处理和应用就是大数据。大数据为社会经济的发展带来了新的机遇,也给传统的经济带来了巨大的冲击。本文就大数据的概念,以及大数据对网络经济的影响进行了详细的阐述。
一、大数据概述
大数据是原先就存在与物理学、天文学以及金融界等各个领域,只是几年来随着网络的飞速发展,在社会当中体现出了越来越多的能量,逐渐引起了相关领域专家的广泛关注。美国在2013年就启动了大数据研究和发展计划,并且在其上面投入了巨大的财力和物力,他们已经意识到,大数据在这信息发达的时代,必将产生巨大的作用。我国在“十二五”国家战略性新兴产业发展规划中,也提出了把大数据进行产业化发展。一时之间各大学术刊物都纷纷发表了大数据探究性文章,大数据成为了社会的热点问题。大数据,简要的说就是通过普通软件无法在有效时间内收集、分析、处理、应用的大规模数据信息。这里所说的大规模通常超过了100TB,并且是高速、实时的数据流。大数据一般具有数据规模大、种类多、价值密度低、处理速度快四个特征。
二、互联网经济的发展
互联网经济是社会经济随着网络的发展,而出现的一种新的经济形态,它主要是人们通过网络进行消费活动的经济现象。在互联网经济中,商品的生产、消费,和主体的经济行为包括信息的获取,市场发展方向的预测、企业发展方向的决策等过程都依赖与互联网。互联网经济主要有以下几个方面的特征:
1、效率高。在互联网经济中,交易双方的交流突破了时间和空间的限制,交易过程也无需等候,极大地提高了工作效率。
2、成本低。消费者可以通过透明的交易平台进行商品的选择,而卖方减少了实体店资金的投入,降低了应运成本。
3、风险大。一方面存在着信誉风险,网络平台的审核机制存在一定的漏洞,给不法分子可乘之机,造成了信誉风险的形成。另一方面,互联网的网络安全,为客户的个人信息以及资金造成一定的威胁。
4、覆盖广。因为互联网经济没有时间和空间的限制,受到了广大青年消费者的青睐,消费群体覆盖面较为广泛。
5、发展快。随着电子商务的快速发展,互联网经济也得以迅猛的发展。
三、大数据与互联网经济的关系
大数据的来源,主要依赖于消费群体通过网上交易留下的信息,以及人们的生产和生活在网络上留下的痕迹,比如网页的浏览、网购等活动。大数据技术就是在这庞大的数据集内提取出有效信息,进行综合分析和判断,判断出消费者的消费倾向、社会的发展方向,给企业的生产和经营以科学的指导意见。大数据产业实现盈利的关键就在于大数据信息的含量和价值。根据IDC和相关部门对大数据调查的结构,大数据蕴含着以下几个方面的价值。对消费群体进行详细的划分,根据划分结果对每一类群体采取相应的商业行为。2、运用大数据,分析出消费者最新的消费动向,对商品的满意程度,以及对商品新功能的期望等等,利用这些分析结果为厂家提供科学生产的指导意见。3、提高大数据研究成果产业化,带动整个产业的发展。4、有利于企业对于商业模式和商品服务的创新。与传统的商业模式相比较,传统的商业模式是通过生产、营销的效果来看生产方向的对错,而大数据背景下的网络经济模式,是通过对以后将会产生的营销效果的预测来指导生产。大数据在数据分析和预测方面的功能使传统商业无法比拟的。由此可见,大数据的存在,为企业的生产方向提供了科学的依据,进行有的放矢地投资和生产,避免了盲目生产带来产品滞销的危险。另外网上交易有效降低了交易成本。大数据依赖云计算技术,为网络经济的发展提供了更多的数据资源,降低供需双方信息的不对称,顺畅了供需渠道,提高了网络交易的效率。但由于大数据所要求的软硬件环境以及监管机制等都越来越严格,这便对网络经济的发展提出了更高的要求。当然,大数据虽然可以完善信息的传递模式,但是在信息监管机制的影响下,差异性供给主体或者需求主体可能会利用自身的优势获取更多信息,加剧了信息的不平等性,继而引发恶性竞争,为此,政府需要从宏观角度进行调控,规范各方交易,构建出完善的竞争格局,保证网络经济行为可以有序的发展。且就我国的情况来看,还缺乏网络经济发展的法律监管体系,无法促进网络经济的可持续发展,尤其是在大数据时代,虚拟经济的风险更大,为此,必须要做好立法监管工作,制定出能够规范和引导网络交易的法律体系,从支付和交易环节来保证网络经济的有序发展。
四、结语
总之,互联网经济的发展,为企业的经营模式的改革起到了促进作用,网络的发展有带动了人们网上活动频率的增加。网上大量的数据信息,为企业的发展带来了巨大的契机,如何利用网络数据对企业的发展方向进行精准的判断,将是企业在互联网经济背景下面临的重要问题。在将来,大数据所存在的问题和困难都会得到良好的解决,届时大数据将会发挥出巨大的魅力,推动世界经济的进一步发展。
参考文献:
[1]郭莉莉.基于网络经济对国民经济影响的经济学分析[J].全国商情(经济理论研究),2016(03).
[2]陈小云.消费者参与社交网络营销因素的实证分析[J].四川理工学院学报(社会科学版),2012(05).
[3]王扬,苗杰.试论网络经济下中国体育用品市场营销策略的研究[J].中国商贸,2010(26).