当前位置: 首页 精选范文 社交媒体研究范文

社交媒体研究精选(五篇)

发布时间:2023-10-09 15:04:43

序言:作为思想的载体和知识的探索者,写作是一种独特的艺术,我们为您准备了不同风格的5篇社交媒体研究,期待它们能激发您的灵感。

社交媒体研究

篇1

(一)传播视频主题多样化,音乐、体育具有较高热门度通过对YouTube上具有一定点击量、较为热门视频的分析可知,其内容主要涉及中国的音乐、饮食、影视、娱乐、习俗等方面,对于中国文化的呈现是多方面的。由于视频分享网站的视听多媒体特性,音乐主题的样本占到了30.1%,其中既有中国的古典音乐,也有现代的流行音乐,还有对国外音乐如《江南style》的中国式改造。影视剧尤其是中国的电影在YouTube上也有一定的收看比例,但数量不多,比重约为8.3%。饮食文化是中国对外文化传播中得到国外受众较多关注的内容,在YouTube中的关注度也仅次于音乐和体育,比重约为10.5%。此外,YouTube的热门视频中,还包括人文景观和旅游类、武术类、习俗类、综合类等内容,但比重较低。具体情况详见图1所示。

(二)中国文化形象以正面为主,少部分领域呈现负面形象本研究对于视频样本涉及的中国文化形象的评价性质进行了1~5分的量表编码,其中非常正面为1分,比较正面为2分,中性为3分,比较负面为4分,非常负面为5分。依据以上得分标准统计,最后得分为2.56,说明文化形象还是偏向正面的。本研究还设置了“正面评价数/负面评价数的比值”指标来考察视频的受众评价度(见图2),大部分视频的正面评价都大大超出其负面评价,负面评价数超过正面评价的仅占6.87%。其他学者在对YouTube等国际新兴自媒体、社交媒体研究中指出,环境、民族宗教等议题涉及到的中国形象偏向负面[4]。与之相比,中国在YouTube中的文化形象呈现出相对的“正能量”。从内容的倾向以及受众的评价反馈来看,文化传播的负面形象主要集中在饮食、体育等方面。中国尽管具有优秀的饮食文化,但YouTube上展现的中国饮食文化形象仍有较多的且影响较大的负面内容,《LACRUELDADENLACOMIDACHI-NA》、《SOPRENDENTESOBRELACOMIDACHI-NA》、《DigustingLiveAnimalEatingInChina》、《SnakedinnerinChinaVeryCool》等展示中国烹饪食用蛇、鼠、活鱼、猫等不佳内容的视频大都具有逾百万次的观看量,而与之相比,《舌尖上的中国》这样展示博大精深、源远流长的中国饮食文化的作品在YouTube上平均只有几十万的观看次数。作为现代社会和消费文化重点的体育领域也成为YouTube上中国负面形象的来源之一,较多体现在体育道德和体育精神不足等方面,这也是需要纠偏和改善之处。

(三)观看次数和受众反馈热度呈现较大落差,总体传播效果仍需加强文化传播的视频由于内容和质量的参差不齐,其本身的分异也属情理之中。但是作为依据热门程度的非概率抽样,本研究中的样本还是显现出较明显的幂律分布特征,少数具有高度点击量的视频占据分布曲线的顶端位置,而大多数视频的观看次数迅速下滑,在200万次左右呈现出显著拐点,超过200万观看次数的视频约为11.5%,观看次数最高的也只有500多万次(见图3)。而在同样以“China”为关键词的未分类的前530个热门视频样本总体库中,观看次数超过200万次的约为22%,最高观看次数达到8000多万次,文化向度相比之下仍然偏“冷”。从受众评论次数来看,视频在受众反馈热度上的差别也十分悬殊,评论数超过7000条的约为7%,多数视频的受众参与评论状况以“长尾”之势在低位徘徊(见图4)。而在具有高受众评论度的文化内容视频中,负面内容占到了半数。这些都显示着中国文化在社交媒体平台中的视听传播,亟待加强优秀的精品内容、经典内容的建设,增强其传播效果。以韩国《江南style》音乐视频为例,其在You-Tube上已有逾17亿的观看次数和600多万条的受众评论。“时至今日,《江南style》已不仅是一个文化产品,……它已变成帮助推销韩国出口商品,包括饮料、化妆品乃至电器的文化品牌。而对于韩国政府来说,《江南style》则俨然成了其在软实力建构上的标志性成果。”对于我国的文化强国建设来说,需要高度重视社交媒体的文化特质和功能,大力引导和鼓励社交网络文化产品创作精品供给,大力推动更多、更优秀的文化视听内容通过YouTube的全球舞台走向和融入世界。图4视频的受众评论数变化曲线图

(四)电视节目是传播的主要来源形式国际社交媒体文化传播具有多种多样的形式,如影视剧、MTV、纪录片、微电影、自拍视频等。对于当前阶段的中国文化传播来说,最主要的来源形式还是电视节目,包括电视的新闻节目、娱乐节目、直播转播节目等,电视节目在各类形式的视频数量中所占比例达到了54%,其中娱乐节目所占过半,《中国达人秀》、《中国好声音》等电视节目成为中国文化国际传播的新兴重要力量,反映了YouTube上中国文化传播的娱乐化态势。此外,由于YouTube和社会化媒体具有内容分享、自媒体的特征,录像、网友自拍摄内容也占较大比例,达到17%。MV、MTV等音乐视频的YouTube传播也比较便捷,占到了12%。电影的传播由于其他渠道的竞争和替代,其比重不大。纪录片、宣传片、网友自制自创视频的比重都很小,有待继续提升。具体情况详见图5所示。图5各类形式视频所占比例

(五)国内外不同来源的视频在数量和形式上存在较显著差异从这些关于中国文化的视频制作来源国来看,国外拍摄制作的只占30.08%,中国拍摄制作的占到了67.67%,未知来源的为2.26%。无论是国内的还是国外的,各类新闻节目、娱乐节目、直播节目等电视节目都占据着视频来源的主体。从传播实效来看,国外视频的平均观看次数为1180736次,国内视频为1113730次,差别不大。其中,来源于国内的视频内容主要取自国内的电视节目,约占61%,其主体包括中央电视台和地方电视台的娱乐、新闻节目,此外也有一小部分的国产电影和专题宣传片。来源于国外的视频内容中,电视节目占到了45%,纪实录像占到了35%。国外视频中录像所占比例大大高于国内,这也体现出国外的视频制作者、提供者对直接进入中国拍摄录像的依赖程度。总体上看,中国文化的国际影响力生成还必须依靠自身的内容制作与供给,同时也不能忽视国外在对于中国文化的间接传播和二次传播中所起的作用。

(六)“传统中国”文化传播的丰富程度显著超出现代文化我国文化“走出去”的战略和举措中,悠久深厚的传统文化一直是对外传播的重要资源。在You-Tube中,“传统文化依赖症”表现比较显著,中国传统文化的传播内容丰富、数量较多,涉及饮食文化、人文景观和文化遗产、传统的风俗习惯、古典音乐、中国功夫等。而中国现当代新兴文化成果、文化要素的呈现则相对单薄,大部分集中在电视节目、影音节目和当代竞技体育项目等方面,缺乏丰富有力的“现代中国”文化形象。以题为《ThisisChina》的一个热门视频为例,它对中国的呈现主要还是故宫、舞狮、琵琶、茶、饺子、太极拳、京剧等传统文化符号,而该片段只在最后几十秒中出现鸟巢等现代文化要素,时间短,且内容意象简单、贫瘠。从另一个角度来说,中国的当代文化通过一些影视节目加强了向国际社会“走出去”的力度,但仍然缺乏优秀的现代文化资源。有研究者指出,“以往在大力展示中国古代文明的过程中,给国际公众留下了太多传统中国的意象。‘古色古香的中国’在一定程度上遮蔽了现代中国的魅力和形象”。YouTube中优秀的现代中国文化形象的建构,不仅需要加大现代文化精品的建设力度,而且还需要改善现代文化因子的传播结构。

二、对策建议

YouTube已是全球化时代的典范新媒体和占有很大市场及流量份额的重要信息平台。当前,中国文化在YouTube中的国际传播还存在一些薄弱环节和方面,加强YouTube中中国文化的传播,不仅是针对YouTube的个案需要,也是以YouTube为重要代表的社会性媒体和视听新媒体的迫切诉求。

(一)加强国际社交媒体的视听精品内容建设,夯实文化走出去的资源基础尽管我国并不缺乏视听文化资源,但是在国际社交媒体的舞台上,还是凸显出承载中国文化的精品视听内容在建设和供给上的短板,尤其缺乏我国自制的并得到广泛传播的优秀视听作品和经典力作。以点击收看状况为例,YouTube中动辄上千万收看次数的热门视频并不罕见,而本研究中观看次数居前的热门视频其平均观看次数只有112万多次,绝大多数的观看次数不超过200万,这体现着社交媒体的经典力作在YouTube上传播的匮乏。就文化主题的热度来看,文化方面的视频在观看次数居前的530个视频样本中占25%,属于YouTube传播的主要维度之一,这既说明文化传播在YouTube中具有丰富的受众需求和发展潜力,也显示着当前对于这种需求和潜力的重视及开发的不足。我国需要推动适合于社交媒体传播的优质视听文化建设,及时开展和实施对外文化传播的社交媒体战略。

(二)引导和发挥网民主体的作用,推动社交媒体时代的“公众文化外交”就本研究而言,来源于国内的热门视频大多数仍是电视节目和电影,而普通民众拍摄或自行制作的视频只占很小一部分。不隶属于任何正式传媒机构或文化组织的网民,其自拍或自制的DV和视频内容未必十分精致,却由于贴近受众需求,主题鲜活、生动等原因也可以取得良好反响。如leeds212上传的题为《VeryfunnyChinesewowvid-eo》(国内题为《魔怔世界》)的一个草根自制视频在YouTube中获得了120多万次的观看量,这已经大大超出国内一些热门的电视、音乐、电影的收看量。国外民间主体对中国的文化经典、风土习俗、饮食、人文景观等文化内容的拍摄纪录和纪实,呈现出比国内间接推广更为直接有效的传播力,但是这些视频的质量及其所反映的中国形象都需要进一步的引导和优化。作为一种社交媒体和典型的“自媒体”,YouTube凸显着个体性、社会性的网民在内容制作、国际信息扩散中的巨大作用,也提出对于公众文化外交的迫切需求。

(三)调整社交媒体对外文化传播的要素结构,加大中国现代文化传播力度国家的对外文化传播应是传统与现代要素的整合与平衡,中国在现代化和文化强国建设的进程中,也要注意避免过多的历史文化要素对现代文化形象的遮蔽。当前,YouTube中的中国传统文化因子较为丰富,而有效的现代文化传播在结构上相对滞后,当代语境下新的文化内容及其传播形式与社交媒体的融合都有待进一步加强。要积极促进传统媒体的“社交化”和国际化发展,探索微电影等适合于社交媒体受众特点和互动特征的媒介产品的国际传播,重点关注音乐、艺术等当代文化领域社交媒体的转换和传播,进行社交媒体平台中文化走出去的资源整合、组织整合与平台整合,对我国社交媒体平台中反映中国当代文化的优秀视听作品开展系统的推广工程,推动中国当代文化形象的构建和整体文化形象的塑造。

篇2

自2011年开始,我国政府机构逐渐开始借助微博推动政府部门的信息服务由“国家模式”向“社会模式”转变,将“被动式”信息服务转向“主动式”信息服务。国家档案局局长杨冬权2011年在全国档案宣传工作会议上指出,要进一步创新档案宣传形式,注重发挥各种新兴媒体的宣传作用,运用各种新的宣传形式,比如动漫形式、网络视频的形式、微博的形式等,吸引更多的宣传受众。目前,我国档案部门已经积极参与到社交媒体的使用中,但同美国档案馆相比,社交媒体在应用范围、形式、运用策略和政策以及取得成效等方面有很大的差距,美国档案馆运用社交媒体的成功经验值得我们借鉴和学习。

一、中美档案馆运用社交媒体的比较

(一)社交媒体的应用范围。目前,我国档案馆对社交媒体的应用十分有限。国家档案馆尚未使用社交媒体,省级档案馆对社交媒体的应用水平参差不齐,总体上仍比较滞后。据相关统计,在我国31个省级( 直辖市、 自治区, 不含港澳台地区) 综合档案馆网站中,应用博客或微博的仅有5个,占16%;应用百科的有6个,占19%;应用RSS或订阅的有11个,占35%;设置论坛的有14个,占45%;设置留言板的有27个,占87%。我国一些偏远地区,如甘肃、、内蒙古地区的档案馆尚未运用任何形式的社交媒体工具。

美国国家档案馆从2009年在YouTube网站上开设界面并创建了第一个“推特”(Twitter)微博账户开始,逐步将档案宣传拓展到博客、微博、百科以及社交网络领域。由于Web2.0社交媒体工具在美国十分流行,美国档案馆利用社会媒体服务信息,与用户交流是十分普遍的。据调查,2012年,美国50个州档案馆中,有42个将社交媒体应用于档案工作中,社交媒体的应用率达到84%,并且这些档案馆的网站都提供YouTube、Facebook、Twitter、Blog等多渠道的交流工具,并专门开设反馈通道,收集用户的意见。

(二)社交媒体的运用形式。根据国内社交媒体营销专家唐兴通的观点,社交媒体可大致分为8类:社会关系网络、视频分享网络、照片分享网络、合作词条网络、新知共享网络、内容推选媒体、商务关系网络、社会化书签。目前,我国档案馆运用的社交媒体形式有论坛、RSS订阅、百科、微博、博客。按功能划分,微博、博客、论坛属于以话题为纽带的信息平台,RSS订阅属于个性化的信息推送平台,若将其归类,笔者认为都应划为内容推选媒体一类;百科则属于合作词条网络。可见,在我国,人们耳熟能详的社交媒体工具如“人人网”“开心网”“豆瓣”“QQ空间”“优酷”“土豆”等社会关系网络、视频和照片的分享网络尚未运用于我国的档案工作中。

美国档案馆运用的社交媒体种类繁多、形式多样。以美国国家档案馆为例,到2013年5月,已在13个社交平台上开设了145个社交媒体项目。这些社交媒体按功能可分为网络平台、社交网络平台、文件的分享与存储平台三大类,每类社交平台包含多种社交工具,如网络平台包括Twitter、Blog、Wiki、Mashups、tumblr等,用户凭借这些工具能随时获得国家档案馆更新的各类信息;社交网络平台包括facebook、foursquare等,这些媒体工具为公众提供了相互交流与协作的空间;文件的分享与存储平台包括Flicker 、Youtube、Pinsterest、Ustream等照片、视频分享与存储工具。可见,美国国家档案馆几乎运用了所有种类的社交媒体工具,并将不同类型、不同用途的社交媒体工具结合使用,充分实现了与公众的互动。

(三)社交媒体传递的信息内容。我国档案馆运用社交媒体所传递的信息内容多为档案部门的行政信息、动态新闻,形式以文本和图片为主。以微博为例,一些档案部门的微博只是进行一些转发,很多还与档案工作无关;档案部门原创的微博内容大多为工作动态、工作要闻,没有对馆藏资源进行深入挖掘。微博如何更新、微博主题如何选择等没有清晰的定位,造成档案部门微博的内容无特色、主题不突出。因此,档案部门的微博很少会受到评论和转发。此外,博客、论坛和网络社区的档案信息多为档案界人士的交流信息及成果展示,这为业内人员相互学习搭建了平台,但与普通公众的互动度不高。

美国档案馆利用社交媒体传递着丰富的信息内容,除行政信息外,美国档案馆对馆藏资源进行深入挖掘,以文字、图片、视频、音频等多种形式展现给公众。例如公众可利用微博和博客分享档案馆的最新信息并进行互动交流;通过访问“Our Archives”Wiki分享关于美国国家档案馆的馆藏及参与者的研究;可以在Flickr上对美国国家档案馆馆藏的照片进行下载、标注标签、发表评论和注释;通过YouTube观看馆藏的部分视频资料;通过Facebook和档案馆保持联系,进行互动交流等。

(四)运用社交媒体的策略和政策。中国在社交媒体上的应用正处于迅猛发展之中,如政府可通过政务微博进行政府信息公开、新闻舆论引导、倾听民众呼声;企业可利用社交媒体工具进行商业活动,开展商业宣传。由于社交媒体具有参与性、公开性、交流性、对话性等基本特征,人们通过社交媒体传递信息、分享观点,易引起广泛关注。目前,我国一些企业和商家在运用社交媒体进行营销时都采取了相应的积极策略和政策。然而,政府部门尚未针对社交媒体的运用制定出相关的策略和政策,档案部门亦是如此。

为充分发挥社交媒体在档案资源传播方面的积极作用, 美国国家档案馆于2010 年12 月在其官方网站上正式公布了社交媒体策略,积极倡导社交媒体在档案工作中的广泛应用,确定与社交媒体合作的核心价值,即合作、领导、激励、多元、团体、开放。策略的制定在于促进政府、团体和公民间的沟通和交流,以充分挖掘档案信息的各种价值,更好地为用户提供利用服务。2011年2月,美国国家档案馆又出台了《Web2.0背景下社交媒体平台文件管理指南》,就社交媒体给档案工作带来的新问题作出了解释并提出应对的策略,如社交媒体平台的分类、联邦政府文件的界定、社交媒体平台与联邦政府文件产生的关系、使用社交媒体后文件管理所面临的挑战、社交媒体服务商责任等。此外,美国国家档案馆还制定了社交媒体政策,对每种社交媒体的使用都作出详细规定,如用户的年龄要求、信息的内容要求等。

(五)运用社交媒体取得的成效。目前,社交媒体在我国各级档案部门虽然得以初步运用,但成效一般。根据中国人民大学档案网站调查与测评项目组的调查显示,我国省级档案馆网站的网上交互指标平均得分率仅为42.75%,其中最能体现交互功能的网上业务咨询、网上论坛得分普遍偏低,分别为0.21和0.23。笔者对档案微博的使用情况进行调查,截至2014年6月25日12点,在新浪微博开通微博并进行认证的省级档案部门(不含直辖市、自治区、港澳台地区)共有6个。通过对检索数据的分析,发现档案馆微博数量偏低,日均量大多1条左右,而每条微博平均评论量不足1条。

可见,社交媒体在实际应用中,其交互功能尚未发挥出来。大部分档案馆虽然设置了“网上咨询”模块,但是回复速度慢,难以满足访问者的及时需求。博客、微博主题不突出、时效性较差,导致用户与档案馆之间的交流和沟通很难深入。

在美国,社交媒体的利用掀起了美国档案资源传播的。2009年,在社交媒体利用之初,美国国家档案馆在Youtube网站“推特”(twitter)微博账户上传的一段视频的日点击播放量达到了1.5万人次。在9个月内,美国国家档案馆上传影片的点播量已超过10万次,视频点播量超过50万次。档案资源传播速度之快,数量之大前所未有。从近期美国国家档案馆的统计来看,各种社交媒体的访问量总体呈上升趋势,例如Twitter,2014年1月至4月,微博客的用户浏览数量不断递增,4个月内用户浏览数量增加了28830人次。在这些社交媒体中,Facebook和Flickr最受公众欢迎,2014年2月Flickr的访问量达到9,925,559人次。由此可见,美国国家档案馆借助社交媒体开展档案文化传播取得惊人成效。

三、美国档案馆成功运用社交媒体的优势分析

通过比较发现,我国档案馆在社交媒体运用方面同美国档案馆相比有很大的差距。笔者认为,我国档案馆运用社交媒体的现状可概况为以下几个点,即社交媒体的应用范围小;运用形式比较单一、交流途径有限;缺少相关策略、政策的引导和规范;公众的参与度低,社交媒体的运用尚未取得实质性的成效。美国档案馆成功地将社交媒体应用于档案工作中,笔者认为有以下几方面的优势。

(一)社交媒体形式多样,内容丰富。美国国家档案馆及各地分馆采用多种形式的社交媒体工具,从Twitter、Blog等信息工具,到Flickr、YouTube等图片、视频分享平台,以及Facebook、Foursquare等社交网络,公众不仅能够了解档案馆的最新动态,浏览形式多样的馆藏资源,同时还可通过互动平台及时表达想法、反馈意见。目前,美国档案馆已开设140多个社交媒体专页和项目,全方位多渠道地把馆藏资源和相关信息推介给公众。

(二)美国国家档案馆的积极倡导。美国国家档案馆作为联邦政府档案工作的最高管理机构,积极倡导社交媒体在全国档案工作中的广泛应用,并积极发挥表率作用,率先在日常工作中使用新技术和方法。同时,美国国家档案馆还了社交媒体策略,即促进档案工作者间革命性的交流与协作;创建与政府社区对话的空间和平台;建立和加强与研究人员、公民档案管理者的联系。该策略旨在从档案工作团体、政府社区、公民档案者三个层面来促进档案资源的共享与共建。

篇3

〔关键词〕社交媒体;信息可信度;评估;综述

〔中图分类号〕G203 〔文献标识码〕A 〔文章编号〕1008-0821(2016)12-0164-06

〔Abstract〕Information credibility assessment research in social media not only contributes to the development and improvement of network information resource management theory,but also helps to improve the effectiveness of social media monitoring public opinion,social media search,social recommendation and so on.The paper firstly reviewed the researches at home and abroad about the social media information research,information credibility research,and social media information credibility assessment research,and then pointed out the problems existing in information credibility assessment research of domestic social media,and finally put forward the solution to it.

〔Key words〕social media;information;credibility;assessment;review

1 研究的意义

随着互联网技术和移动技术的突飞猛进,社交媒体盛行,人人可做信息的制造者,制造的信息极为丰富。然而,在这丰富信息的背后,隐藏着漫天飞舞的谣言、病毒般传播的虚假照片和视频,这给人们幸福的生活、社会的稳定带来了严重的隐患。为了遏制虚假不良信息传播,营造健康向上的网络环境,信息可信度评估就成了迫在眉睫的问题,社交媒体信息急需“鉴定师”和“测谎仪”。

社交媒体信息可信度评估研究既有较高的学术价值,也有较强的应用价值。具体来说,学术价值表现在研究社交媒体信息可信度评估并探讨虚假信息的生成机制、传播模式、治理措施,是对社交媒体环境下网络信息资源管理理论的丰富、发展与完善。应用价值表现在研究社交媒体信息可信度评估有助于社交媒体用户判断信息的可信性,营造诚信健康的互联网环境,也有助于提高社交媒体信息舆情监控、社交媒体信息引导、社交媒体搜索、社会化推荐等方面的效果。

2 社交媒体信息研究

社交媒体(Social Media)是通过Web2.0技术实现的一类支持用户自主创造和交换内容的媒体,如Twitter、Facebook、Youtube、LinkedIn、Wiki、微博、微信、QQ、论坛、人人网等。自1973年Lipkin、Szpakowski和Felsenstein 3人在美国加州伯克利市建立全球第一个公共电子公告牌系统 Community Memory后,BBS以及网络社区等早期的社交媒体开始映入人们的眼帘。《2015年全球社会化媒体、数字和移动业务数字统计趋势》报告表明:全球社交媒体活跃用户约占全球人口的29%。

2.1 国外研究

社交媒体的相关研究从20世纪80年代开始,在2005年左右开始进入快速发展阶段,发文量有逐年增加的趋势。在国际期刊中,发表社交媒体论文较多的要属《Computers in Human Behavior》。近两年,关于社交媒体的国际会议主要有ASONAM、SMP、MISNC、SMAP、SCSM。国外学者研究内容主要集中在以下4个方面:

2.1.1 社交媒体信息利用研究

社交媒体在商业领域、教育领域、公共管理领域等都有广泛的应用[1]。如在营销领域,利用社交媒体信息,可以获知消费者态度和行为[2],可以获知客户交流和推荐对营销的影响[3-4],可以获知社交媒体信息对营销管理功能的影响[5]。

2.1.2 社交媒体信息检索与信息推荐研究

侧重于社交媒体信息检索与信息推荐方法的研究。社交媒体信息的检索采用主题模型[6]、社会网络[7]、本体[8]等检索方法。比如,Hong和Davison(2010)使用标准主题模型进行社交媒体Twitter信息的检索。社交媒体信息的推荐采用内容推荐[9]、协同过滤[10]、时序推荐[11]、位置推荐[12]、社会化推荐[13]等方法。比如,Levandoski等(2012)提出位置感知推荐系统(LARS)[12]。

2.1.3 社交媒体信息传播研究

侧重于反映信息传播传播规律的社交媒体信息传播模型的构建以及通过模型的构建对实际问题进行预测等方面的研究。如Galuba等(2010)通过研究1 500万URL在不同Twitter用户之间的300小时传播,提出了基于内容流行度、用户影响力和传播速度的线性阈值模型[14]。Adar和Adamic(2005)通过研究信息在博客中传播的模式和动力学特性,提出用传染病模型来描绘信息传播的机理[15]。Asur和Huberman(2010)采用来自的聊天数据通过简单的线性回归模型预测电影票房的收入[16]。

2.1.4 社交媒体用户隐私研究

在探讨社交媒体用户隐私现存问题的基础上,提出了相应的隐私保护方法。如Viswanath等(2010)首先研究Sybil防御的缺陷,在其基础上探讨了替代Sybil防御的方法[17]。Conti等(2011)采用FaceVPSN解决社交媒体用户隐私问题[18]。

2.2 国内研究

国内学者的社交媒体研究最早可追溯至20世纪90年代末,但从2005年后起关于社交媒体的论文才逐渐表现出增长态势。国内研究内容主要集中在:

2.2.1 社交媒体信息传播研究

研究内容包括:①社交媒体信息传播模式研究。如韩佳等(2013)提出了基于改进SIR的在线社交网络信息传播模型[19]。姜景等(2015)构建表征谣言信息与辟谣信息传播机理的Lotka-Volterra竞争模型[20]。②社交媒体信息传播中存在的问题与对策研究。如阎俊(2015)探讨微博传播存在的问题及原因,并提出了加强微博内容管理、增强把关意识、提高微博用户的媒介素养等对策[21]。③社交媒体信息传播效果研究。如陈远和袁艳红(2012)以新浪微博作为数据来源,把信息覆盖人数、评论数、转发数作为微博信息传播效果的量化指标,从纵横向两个角度研究新浪微博信息传播过程造成的效应[22]。

2.2.2 社交媒体舆情分析与监测研究

如张J等(2014)以打砸日系车系列突发公共事件为实例,探讨其在新浪微博和新浪新闻平台上舆情传播的特征与规律[23]。张瑜等(2015)对新浪微博热门话题“北京单双号限行常态化”下的微博进行了数据采集,将舆情演化划分为潜伏、成长、爆发、衰退、波动、死亡6个阶段,并对各阶段进行情感分析,为舆情治理提供了支持[24]。唐涛(2014)在分析网络舆情五要素的基础上,探讨移动互联网舆情的新特征,指出面临的新挑战,并从信息分析、信息筛选、信息引导等方面提出对策[25]。

2.2.3 社交媒体营销研究

如唐兴通(2012)的著作《社会化媒体营销大趋势:策略与方法》系统总结了社交媒体营销,并对众多社交媒体工具在实际工作中的应用提供了具体的建议[26]。张淼(2014)提出了企业完善社交媒体营销策略的“9+3”模式[27]。刘晓燕和郑维雄(2015)采用社会网络分析方法研究企业微博营销传播的效果[28]。

3 信息可信度研究

3.1 国外研究

信息可信度(Information Credibility)是指人们对信息可相信程度的认识。它由值得信赖(Trustworthiness)和专业性(Expertise)两个关键要素组成[29]。信息可信度比较系统的研究始于20世纪50年代的传播领域。Hovland和同事的工作具有里程碑的意义[30]。信息可信度最初关注的是传播者的可信度。国外对传统媒体信息可信度的研究主要是从信源可信度、内容可信度、渠道可信度三方面展开的。随着互联网的出现,网络信息可信度的评估被提上了议事日程。研究情况可归纳如下:

3.1.1 网络信息可信度评估的理论模型

主要有Fogg(2003)的P-I理论模型、Wathen和Burkell(2002)的评判模型、Sundar(2008)的MAIN Model、Hilligoss和Rieh(2008)的统一模型、Metzger(2007)的双处理模型以及Lucassen等(2013)的3S模型(修订版)。以上理论模型是由情境、用户特征、操作性、处理过程这些侧面的若干部分构建而成的。

3.1.2 网络信息可信度研究内容

主要有对网络新闻的可信度研究、对搜索引擎结果的可信度研究以及对维基百科内容的可信度研究。比如,Nagura等(2006)通过比较关于同一主题不同网页的相似度来计算每个网页的可信度[31]。Yamamoto和Tanaka(2011)利用用户可信度评判模型对网页搜索结果进行重新排序,以便从Web搜索结果的列表中用户可以更高效的找到可信的网页[32]。Adler等(2008)以文章长度、版本数量和基于贡献数量的作者声誉建立模型,计算出维基百科文章的可信度[33]。

3.1.3 网络信息可信度研究方法

主要采用定量研究法。比如,Olteanu等(2013)在调查网页的各种特征(文本内容、链接结构、网页设计等)的基础上,经过统计分析方法筛选出关键的特征,采用监督学习算法来推断网页内容的可信度[34]。与网络信息可信度有关的典型系统有日本的WISDOM和Honto?Search。

3.1.4 影响力较大的项目和国际会议

影响力较大的项目有互联网可信度研究(The Web Credibility Research)项目,影响力较大的国际会议有WICOW(Workshop on Information Credibility on the Web)。

3.2 国内研究

1993年的《鉴别虚假信息五法》是国内发表的早期论文。2004年至今,相关研究进入快速发展期。相对于国外较多研究评估算法和评估系统,国内研究重点在于定性分析上,大多采用问卷调查及专家访谈法等进行人工评估。国内研究内容主要有:

3.2.1 侧重于信息可信度影响因素研究

比如,龚思兰等(2013)针对评论信息的文本内容、长度、情感倾向、时效性、者、商家活动等特征,通过问卷调查方式对大学生消费群体进行在线商品评论信息可信度影响因素实证分析[35]。蒋洪梅(2013)运用理论分析辅以实证研究的方法,从宏观的社会系统、中观的政策法规、微观的媒介与受众3个视角分析网络新闻信息可信度的影响因素[36]。

3.2.2 侧重于信息可信度指标体系的构建

比如,胡红亮(2013)按照信息源、信息加工、信息传播和信息应用等方面采用德尔菲专家调查法建立了学术著作可信度的基本评价模型[37]。潘勇和孔栋(2007)基于第三方认证机构的视角,构建了电子商务网站的信用评价指标体系及评价因素集,并建立灰色关联信用评估模型[38]。当然,也有少量基于机器学习的信息可信度自动化评估实验研究,比如,马伟瑜(2011)提出一种采用改进的PageRank算法评估网页信息可信度的方法[39]。

4 社交媒体信息可信度评估研究

4.1 国外研究

国外相关研究较早。社交媒体信息可信度的相关研究随着BBS的出现随之展开,最早可追溯到20世纪80年代。目前可以说,研究处于繁荣期。国外研究情况可归纳如下:

4.1.1 社交媒体信息可信度评估研究内容

研究内容主要包括:①不实信息的判断识别。如Qazvinian等(2011)提取Twitter信息的文本特征、网络特征和微博元素特征,构建贝叶斯分类器甄别谣言[40]。Zhao等(2015)通过研究查询帖以便及早识别社交媒体谣言[41]。②话题新闻的可信度评估。如Castillo等(2011)选取了有关用户特征、文本特征、主题特征、信息传播特征,采用J48决策树评估Twitter中话题新闻的可信度[42]。

4.1.2 社交媒体信息可信度评估方法

评估方法主要有监督学习[43],统计分析[44],与可信信息来源的相似性比较[45-46],社交网络的链接结构分析与主题模型的利用[47]等。它们主要采用自动评估,具体来说:①选取的特征:选取的特征主要是用户特征、文本特征、信息传播特征。比如,西班牙的Castillo和智利的Mendoza、Poblete(2011)选取用户特征(如注册时间、粉丝量、好友量),文本特征(如是否包含#标签、是否包含问号、Tweet中包含的URL数量、是否转发),主题特征(如带#标签Tweet的比例、Tweet数量、Tweet的平均长度、Tweet的平均情感分值、积极情绪或消极情绪的比例),以及信息传播特征(如传播树的深度),采用J48决策树评估Twitter信息的可信度[42]。②评估的方法:大多通过构建SVM分类器、Bayesian分类器、Decision Tree分类器等方法,并对结果进行分类,以达到评估社交媒体信息可信度的目的。上例Castillo等采用J48决策树构建分类器,并对结果进行分类,从而评估Twitter信息的可信度[42]。当然,也有通过对结果进行排序的实例,从而达到评估社交媒体信息可信度的目的。比如,Gupta和Kumaraguru(2012)采用Rank-SVM与PRF相结合的方法,按照可信度得分对Twitter信息进行排序[43]。

4.1.3 有较大影响的在研项目与系统

由欧盟资助七国科研人员联合攻关的PHEME项目研究的重点是社交媒体信息的真实性,该项目在国际上有较大影响。Jacob Ratkiewicz等(2011)开发出可实时追踪Twitter上政治谣言的Truthy系统[48]。Gupta等(2014)、Lorek等(2015)分别开发出一款可自动评估推文可信度的工具TweetCred、TwitterBOT[49-50]。

4.2 国内研究

2007年《博客信息“可信度不亚于纽约时报”?》拉开了国内探讨社交媒体信息可信度评估的序幕。目前研究还处于发展的初期。社交媒体信息可信度评估研究主要有:

4.2.1 社交媒体信息可信度影响因素研究

如刘雪艳和闫强(2013)探讨政府微博中的热点事件信息可信度的影响因素[51]。丁科芝(2015)从信息传播者、渠道、信息内容和用户基本信任观念4个方面构建社交网络可信度影响因素模型[52]。薛传业等(2015)从信息来源可信度、信息传播渠道可信度、信息内容可信度以及信息评论反馈多维度探讨了突发事件中社交媒体信息可信度的影响因素[53]。

4.2.2 构建社交媒体信息可信度指标体系研究

它大多采用问卷调查及专家访谈法进行人工评估。屈文建和谢冬(2013)从站点层次、版块层次、主题层次、内容层次4方面,采用模糊综合信用评估模型对网络学术论坛信息可信度进行评估[54]。莫祖英等(2013)从微博信息量、信息内容质量、信息来源质量和信息利用情况等方面进行问卷调查,采用层次分析法构建微博信息质量评估模型[55]。当然国内也有少量自动化评估的例子。比如,贺刚等(2013)引入关键词分布特征和时间差等新特征,基于SVM算法来预测新浪微博信息是否为谣言[56]。程亮等(2013)提出基于BP神经网络模型及改进其激发函数,同时引入冲量项,对微博话题在传播过程中演变为谣言进行检测[57]。路同强(2015)采用半监督学习算法检测微博谣言,但不足之处在于未考虑信息的深层特征[58]。

4.3 存在的问题

对比国内外研究情况,可发现国内研究存在如下问题:

4.3.1 研究内容

关于社交媒体信息可信度研究,国内外目前以微博研究较多。与国外丰富的研究内容相比,国内在该领域的研究还主要集中于对影响因素以及特征的探讨上。

4.3.2 研究方法

国外定量研究较多,很多涉及自动化评估,而国内定性研究较多,大多采用问卷调查法、专家访谈法等进行人工评估。

总之,现有研究大多是针对Twitter等英文社交媒体,其研究成果大多不能直接应用于中文社交媒体。尽管也有少量研究是面向中文社交媒体的,但研究成果零散,还缺乏系统性。另外,在特征选择上,选择范围面较窄,考虑社交媒体深层的隐含特征较少。

5 结 语

为了解决中文社交媒体的可信度评估问题,在吸收前人研究的基础上[59-63],很有必要对中文社交媒体信息可信度进行系统研究,特别是在参考国外信息可信度评估系统的基础上,很有必要研制开发中文社交媒体信息可信度评估系统,实现中文社交媒体信息可信度的自动评估。在进行中文社交媒体信息可信度评估中,应注意下列问题:

1)评估要在对信息资源分类的基础上,对不同的类别采用不同的评估指标体系,以提高评估工作的科学性和合理性。

2)评估既要重视定性评估,也要重视定量评估,尤其是自动化评估。特别是在大数据环境下,应针对评估的实际需求,制定科学的评估方案,选择恰当的评估方法,构建适合评估工作需要的自动化评估系统。

3)评估指标、评估模型的选取以及参数的训练,既要考虑研究结果的精确度,又要考虑系统的运算时间。

4)评估模型构建后,不仅要进行实验室评估,还应进行实际效果评估。

参考文献

[1]Ngai,E.W.T.,Moon,K.K.,Lam,S.S.,Chin,E.S.K.and Tao,S.S.C..Social media models,technologies,and applications[J].Industrial Management and Data Systems,2015,115(5):769-802.

[2]Gamboa,A.M.and Gonalves,H.M..Customer loyalty through social networks:lessons from Zara on Facebook[J].Business Horizons,2014,57(6):709-717.

[3]Jin,S-A.A.and Phua,J.Following celebrities tweets about brands:the impact of Twitter-based electronic word-of-mouth on consumers source credibility perception,buying intention,and social identification with celebrities[J].Journal of Advertising,2014,43(2):181-195.

[4]Colliander,J.and Dahlén,M.Following the fashionable friend:the power of social media[J].Journal of Advertising Research,2011,51(1):313-320.

[5]Moncrief,W.C.,Marshall,G.W.and Rudd,J.M..Social media and related technology:drivers of change in managing the contemporary sales force[J].Business Horizons,2015,58(1):45-55.

[6]Hong,Liangjie and Davison,B.D..Empirical study of topic modeling in twitter[C]∥Proceedings of the First Workshop on Social Media Analytics(SOMA10).ACM,New York,NY,USA,2010:80-88.

[7]Kleinberg,J.M..Authoritative sources in a hyperlinked environment[J].Journal of the ACM,1999,46(5):604-632.

[8]Tobar,C.M.,Germer,A.S.,Adan-Coello,J.M.,and De Freitas,R.L..Information retrieval in Wikis using an ontology[J].Computational Science and Engineering,2009:826-831.

[9]Kim,Y.and Shim,K.TWILITE:A recommendation system for Twitter using a probabilistic model based on latent Dirichlet allocation[J].Information Systems,2014:59-77.

[10]Ramesh,A.,Anusha J.,Clarence,J.M.T..A novel,generalized recommender system for social media using the collaborative-filtering technique[J].ACM SIGSOFT Software Engineering Notes,2014:1-4.

[11]Zimdars,A.,Chickering,D.M.,and Meek,C.Using Temporal Data for Making Recommendations[C]∥Proceedings of the Seventeenth conference on Uncertainty in artificial intelligence(UAI01),Jack Breese and Daphne Koller(Eds.).Morgan Kaufmann Publishers Inc.,San Francisco,CA,USA,2001:580-588.

[12]Levandoski,J.J.,Sarwat,M.,Eldawy,A.and Mokbel,M.F..LARS:A Location-Aware Recommender System[C]∥IEEE 28th International Conference on Data Engineering,Washington,DC,2012:450-461.

[13]Jamali,M.and Ester,M.Trust Walker:a random walk model for combining trust-based and item-based recommendation[C]∥Proceedings of the 15th ACM SIGKDD international conference on Knowledge discovery and data mining(KDD09).ACM,New York,NY,USA,2009:397-406.

[14]Galuba W,Aberer K,Chakraborty D,Despotovic Z,Kellerer W.Outtweeting the twitterers-predicting information cascades in microblogs[C]∥Proceedings of the 3rd Workshop on Online Social Networks,USENIX Association,Boston,MA,USA,2010:1-9.

[15]Adar,E.and Adamic,L.A..Tracking Information Epidemics in Blogspace[C]∥Proceedings of the 2005 IEEE/WIC/ACM International Conference on Web Intelligence(WI05).IEEE Computer Society,Washington,DC,USA,2005:207-214.

[16]Asur,S and Huberman,B.A..Predicting the Future with Social Media[C]∥2010 IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology(WI-IAT),Toronto,2010:492-499.

[17]Viswanath,B.,Post,A.,Gummadi,K.P.,and Mislove,A.An analysis of social network-based Sybil defenses[J].Acm Sigcomm Computer Communication Review,2010,40(4):363-374.

[18]Conti,M.,Hasani,A.,and Crispo,B.Virtual Private Social Networks[C]∥Proceedings of the 1st ACM Conference on Data and Application Security and Privacy(ACM SIGSAC CODASPY 2011),San Antonio,TX,USA,2011:39-50.

[19]韩佳,肖如良,胡耀,等.在线社交网络中信息传播模式的特征分析[J].计算机应用,2013,(1):105-107,111.

[20]姜景,李丁,刘怡君.基于竞争模型的微博谣言信息与辟谣信息传播机理研究[J].数学的实践与认识,2015,(1):182-191.

[21]阎俊.微博传播的问题与对策研究[D].锦州:渤海大学,2015:1-38.

[22]陈远,袁艳红.微博信息传播效果实证研究[J].信息资源管理学报,2012,(3):28-34.

[23]张,孙霄凌,朱庆华.突发公共事件舆情传播特征与规律研究――以新浪微博和新浪新闻平台为例[J].情报杂志,2014,(4):90-95.

[24]张瑜,李兵,刘晨.面向主题的微博热门话题舆情监测研究――以“北京单双号限行常态化”舆情分析为例[J].中文信息学报,2015,(5):143-151,159.

[25]唐涛.移动互联网舆情新特征、新挑战与对策[J].情报杂志,2014,(3):113-117.

[26]唐兴通.社会化媒体营销大趋势:策略与方法(第2版)[M].北京:清华大学出版社,2012:1-235.

[27]张淼.社会化媒体在市场营销中的应用研究[D].北京:首都经济贸易大学,2014:1-47.

[28]刘晓燕,郑维雄.企业社会化媒体营销传播的效果分析――以微博扩散网络为例[J].新闻与传播研究,2015,(2):89-102,128.

[29]Fogg,B.J.,and Tseng,H.The elements of computer credibility[C]∥Proceedings of the SIGCHI conference on Human Factors in Computing Systems,Pittsburgh,Pennsylvania,USA,1999:80-87.

[30]Rieh,S and Danielson,D.Credibility:A Multidisciplinary Framework[J].Annual Review of Information Science and Technology,2007:307-364.

[31]Nagura,R.,Seki,Y.,Kando,N and Aono,M.A method of rating the credibility of news documents on the web[C]∥Proceedings of the 29th annual international ACM SIGIR conference on Research and development in information retrieval(SIGIR06).ACM,New York,NY,USA,2006:683-684.

[48]Ratkiewicz,J.,Conover,M.,Meiss,M.,Gonalves,B.,Patil,S.,Flammini,A.and Menczer,F.Truthy:mapping the spread of astroturf in microblog streams[C]∥Proceedings of the 20th international conference companion on World wide web(WWW11).ACM,New York,NY,USA,2011:249-252.

[49]Gupta,A.,Kumaraguru,P.,Castillo,C.,and Meier,P.TweetCred:Real-Time Credibility Assessment of Content on Twitter[C]∥Social Informatics.Springer International Publishing,2014:228-243.

[50]Krzysztof,L.,Jacek,S.W.,Michal,J.L.,and Amit,G.Automated Credibility Assessment on Twitter[J].Computer Science,2015,(2):157-168.

[51]刘雪艳,闫强.政府微博中的热点事件信息可信度研究[J].北京邮电大学学报:社会科学版,2013,(2):6-12.

[52]丁科芝.社交网络信息可信度研究[D].武汉:华中师范大学,2015:1-61.

[53]薛传业,夏志杰,张志花,等.突发事件中社交媒体信息可信度研究[J].现代情报,2015,(4):12-16.

[54]屈文建,谢冬.网络学术论坛信息可信度的灰度分析[J].图书情报知识,2013,(2):112-118.

[55]莫祖英,马费成,罗毅.微博信息质量评价模型构建研究[J].信息资源管理学报,2013,(2):12-18.

[56]贺刚,吕学强,李卓,等.微博谣言识别研究[J].图书情报工作,2013,(23):114-120.

[57]程亮,邱云飞,孙鲁.微博谣言检测方法研究[J].计算机应用与软件,2013,(2):226-228,262.

[58]路同强,石冰,闫中敏,等.一种用于微博谣言检测的半监督学习算法[J].计算机应用研究,2016,(3):744-748.

[59]Ginsca,A.L.,Popescu,A.,and Lupu,M.Credibility in Information Retrieval[J].Foundations and Trends in Information Retrieval,2015:355-475.

[60]Lazar,J.Meiselwitz,G.and Feng,J.Understanding Web Credibility:A Synthesis of the Research Literature[M].Now Publishers Inc,2007:1-80.

[61]Zafarani,R.Abbasi,M.A.,and Liu,H.社会媒体挖掘[M].北京:人民邮电出版社,2015:1-240.

篇4

(浙江工商大学学院 浙江 杭州 310018)

摘 要: 社交媒体是把双刃剑,一方面它具有锻炼大学生情感表达能力、减少现实交流障碍以及节约交往成本等多方面的积极影响;另一方面,它也在一定程度上疏离了现实同学关系、弱化了现实交往能力、降低了人际信任度。高校辅导员应引导大学生在全面把握社交媒体的基础上合理利用社交媒体,构建和谐的同学关系。

关键词 :社交媒体;大学生;同学关系;高校辅导员

中图分类号:G641 文献标识码:A doi:10.3969/j.issn.1665-2272.2015.14.044

中国互联网络信息中心的《第35次中国互联网络发展状况统计报告》显示,截至2014年12月,学生群体在中国网民中占比23.8%,在所有群体的互联网普及率中居于高位。大学生思维敏锐,接收新事物能力强,更是处于技术创新浪潮的最前端,社交媒体也因不断地发展创新得到大学生的青睐。社交媒体极大地丰富和拓展了大学生人际交往的方式和内容,但它的负面效应不容忽视。正确引导大学生使用社交媒体,构建和谐同学关系成为高校辅导员的重要任务。

1 社交媒体概述

社交媒体是建立在万维网的技术资源基础上,允许用户创建和交换各方面信息的应用程序。其典型代表是腾讯QQ、新浪微博、微信、人人网等。当今时代,越来越多的大学生热衷于社交媒体,花费在社交媒体上的时间越来越多,这与社交媒体的以下四方面特征密不可分。

1.1 交互性与共享性

马克思认为人的本质是一切社会关系的总和,每个人都有与他人沟通交流的心理需求。通过社交媒体,用户可以随时保持沟通、给别人发表评论,还可以将所见所闻第一时间出去与其他用户共同分享。这种互动与共享能够使用户结交来自世界各地的朋友,拓展人际网络,满足现实生活中不能满足的交往、情感需求。

1.2 开放性与平等性

当今大学生开放程度高,个体意识强,平等观念深。社交媒体使交往不再受时间、空间等因素的限制,加之有些社交媒体为匿名登陆,使得信息与获取的自由性进一步增强,便于大学生找到自己的“圈子”发展兴趣。这样,社交媒体打破传统媒体的精英运作模式,原先传播者与受众的失衡关系得到平衡。因此,社交媒体的开放是基于所有人的开放,它为每个人提供了更为公平的机会,开放和平等成为社交媒体发展的动力和源泉。

1.3 娱乐性与个性化

冰心曾说过,娱乐至少与工作有同等的价值,或者说娱乐是工作的一部分。当今社会,娱乐必不可少,绝大部分社交媒体都有供用户来娱乐消遣的板块,如QQ游戏、QQ宠物、QQ空间日志,以及微博、微信等媒体提供的娱乐图片、视频以及各种热门话题;社交媒体大都具有强烈的个性化色彩,具体表现在主页装饰、页面排版以及聊天背景等细节设置上,用户可以以多种形式、转载、评论信息。

1.4 融合性与“碎片化”

社交媒体是报纸、杂志、电视、广播等媒介融合的有效平台,兼容文字、图片、动画、声音、影像等多种传播形态,通过不同的组合方式来表述、发送信息,这能够满足不同用户的个性化需求。同时,许多社交媒体要求发送内容简短精炼,信息的这种碎片化倾向使大学生能够随时随地学习新知识,充分利用零散时间,如微电影、微视频等“微”事物广受大学生的青睐。

2 社交媒体对大学同学关系的影响

2.1 社交媒体对大学同学关系的正面影响

(1)有利于锻炼大学生的情感表达能力。《诗经》中传唱千载的“嘤其鸣矣,求其友声。相比鸟矣,犹求友声”,传递出每个人内心深处对与人交往、表达的渴望。然而,有些大学生因不善交际或害羞、自卑、社交恐惧等心理障碍的禁锢,在现实生活中不善于同别人互动交流,无法充分表达自己的情感,甚至把自己孤立起来,阻碍了正常的同学交往。社交媒体具有匿名性、开放性、平等性等特征,这为大学生提供了充足的锻炼机会,更好地满足大学生情感的表达与传递,使大学生在现实生活中沟通更自由。

(2)有利于减少大学生人际交往的客观障碍。大学生来自四面八方,每个人生活习惯不同,家庭背景等亦存在差异,交流起来很容易出现误解甚至产生矛盾。科技的飞速发展实现了麦克卢汉“地球村”的预言,社交媒体的出现打破了传统交往基于血缘、地缘的格局。通过社交媒体,大学生有机会充分接触不同地域的道德风俗习惯、伦理规范以及思想观念等,能开阔眼界,更好地了解各地域同学的生活习惯,进而使大学生增强对交流信息的理解,减少交流过程中的摩擦和碰撞,交往起来更得心应手。

(3)有利于大学生节约交往成本。高校班级概念逐渐淡化,同班同学日常见面机会逐渐减少,毋庸置疑,同学间要经常性的互动交流才能保持同学关系的稳定性和持久性。然而,专注于现实交往成本过高,网络交往是现实交往的重要补充,社交媒体成为人际联络的好帮手。同学间可以通过网络保持联系。一方面,大学生无需话费只需要WIFI或者流量就可以使用社交媒体来维持人际关系,节约了经济成本;另一方面,使用社交媒体只需动动手指就能关注对方动态,及时掌握最新资讯,社交媒体使人际交往变得更加方便和快捷,节省了大量的时间和精力。

(4)有利于缓解大学生的日常压力。大学生在校内会面临来自生活、学习上的各种压力,面对这些压力产生的消极情绪,有些大学生往往得不到社会支持系统(家长、老师等)的慰藉,转而把目光投向社交媒体。社交媒体具有开放性、平等性以及娱乐性等特征,大学生可以在网上痛痛快快地打游戏、开开心心地看视频、随心所欲地聊天……他们就像一条自由自在的鱼儿遨游在大海里。这样,不良情绪就能随着手指摆动而“烟消云散”,积极情绪便会“扑面而来”,这种积极情绪有益于和谐同学关系的构建与维护。

2.2 社交媒体对大学同学关系的负面影响

(1)疏离现实同学关系。社交媒体内在的交互性、开放性、自由性、娱乐性等特征,使部分大学生浏览各大社交网站成为一种习惯,以至于吃饭走路甚至在同学聚餐等公共活动中都要时不时聊QQ、玩微信、刷微博,有些人甚至形成了社交媒体依赖。结果,大学生交往有广度而缺乏深度,缺乏心灵沟通,增加了内心的孤独感。寝室同学关系更是如此,马斯洛需求层次理论认为归属感是人的基本需求,同住一个屋檐下的室友很少有机会静下心来真诚地沟通,他们把归属感转移到各种虚拟网络社区,导致同学情感上趋于冷漠、疏离,以至有人毕业时要“感谢室友的不杀之恩”。

(2)弱化现实交往能力。在网络上扮演好角色比在生活中容易,开放、平等、自由的社交媒体使大学生在交往中更加具有随意性。大学生在现实生活中交往要受到外部环境,个人角色及言语、声调、表情、姿势、服装等太多非语言信息的束缚,长时间的网络交往使他们难以适应二者间的角色转换,以至于对现实交往力不从心。他们找机会逃离现实交往,向网络寻求安慰,把更多的时间花在社交媒体上。

(3)降低人际信任度。社交媒体具有匿名性、开放性的特点。这导致网上道德约束力不强,网民可以在这个虚拟的空间中自由交流,这给那些不法行为带来了施展机会,网上虚假信息遍布,道德失范现象严重,网络诈骗、网络犯罪等时有发生。大学生社会经验、人生阅历不足,在虚拟的网络世界很容易受骗,一旦被骗,就会对他们正在成长的心灵产生巨大影响,他们会本能地对周围人失去信任,防止悲剧再次发生;即使没有被骗经历,经常看到网上曝光的庞杂负面的新闻,亦会把社会上的不信任带到现实生活中,导致同学之间的信任度降低,使人际关系蒙上阴影。

3 合理利用社交媒体,构建和谐的大学同学关系

社交媒体给大学同学关系带来的影响有利有弊,是利大于弊还是弊大于利?问题的关键是能否合理运用社交媒体。合理用之,利大也;过度用之,弊大也。

3.1 利用社交媒体开展教育工作

大学生使用社交媒体的潮流势不可挡,辅导员也应该积极顺应这一潮流,使之为构建和谐同学关系服务。因此,辅导员应该熟练掌握主流社交媒体,尽可能与大学生成为好友,及时掌握他们的思想动态,减少他们人际交往中的困惑;在上网交流的过程中向大学生提供一些关于人际交往的方法、技巧以及心理健康方面的知识,为现实人际交往做好理论铺垫;同时,辅导员还应经常性地在主流社交媒体上分享一些集思想性、趣味性、创新性于一体的优秀资源,让大学生充分吸收正能量。

3.2 帮助大学生提高社交媒体素养

社交媒体对同学关系的消极影响反映出大学生的社交媒体素养有待提高,辅导员要帮助大学生提高社交媒体素养,就应该教育大学生:全面、准确地认识和对待社交媒体——既要认识到它可以锻炼情感表达能力、减少交流障碍等有利的一面,又要清醒地认识到它消极的一面,使之为我所用;从我做起,促进网络文明化、道德化——在提高防范意识、提高信息批判能力以及自觉抵制不良信息的影响的同时,还要自觉传播正能量(比如,与他人聊天时聊一些高雅的、有品位的话题,使聊有所得);合理控制上网时间——大学生要加强自律,抵制社交媒体的诱惑,把更多的时间、精力用于现实交往和其他更有意义的事情上。

3.3 组织丰富多彩的校园活动

现实交往是“本”,网络交往是“末”,要防止大学生本末倒置或者舍本逐末,辅导员应该充分发挥大学生社团的重要作用,积极加强线下工作,经常性地开展为大学生喜闻乐见的校园活动,如读书月活动、体育周活动、辩论赛、演讲比赛、节日晚会等。这不但能够减少大学生的上网时间、发展业余爱好找到自己的“圈子”,而且能够提供广阔的平台为大学生锻炼现实人际交往能力,提高交际水平。

3.4 重视构建和谐寝室同学关系

清华大学朱令案、马加爵案以及复旦大学投毒案等几起恶性杀人事件都是发生在寝室内,寝室人际关系原本就存在问题,社交媒体出现后更使某些寝室人际关系雪上加霜。辅导员应有针对性的加强和谐的寝室同学关系的构建,可行性路径为:鼓励学生设计健康丰富的寝室文化;定期进入学生宿舍了解大学生的学习、生活状况;多开展以寝室为单位的活动。这样能更好地增强室友间的默契和凝聚力,让寝室成为情感沟通的场所,成为大学生的“心灵港湾”。

4 结语

社交媒体以其鲜明的特征成为大学生使用的主流媒体,它给大学生带来了平等、自由,却使他们丧失了安全感、归属感。辅导员应在倡导、鼓励大学生现实交往的基础上引导他们合理利用社交媒体。这样,大学生才能找到心灵的最佳归属,使那颗冰冷、孤独的心得到缕缕温情与安抚;才能在共同的学习和生活中形成互相关心、相互帮助、互相促进、良性竞争的一种积极状态;才能在美好而短暂的青春年华里充分吸收营养、绽放光芒。

参考文献

1 巴巴拉·M·纽曼.社交媒体影响青少年同伴关系:友谊、孤独感和归属感[J].中国青年研究,2014(2)

2 马克思,恩格斯.马克思恩格斯选集[M](第一卷).北京:人民出版社,1995

3 严三九.新媒体概论[M].北京:化学工业出版社,2011

4 王晓霞.现实与虚拟社会人际关系的文化研究[M].北京:中国社会科学出版社,2010

篇5

关键词:语义标注 社交媒体 信息抽取

中图分类号: TP311 文献标识码: A 文章编号: 1003-6938(2013)05-0095-05

1 引言

社交媒体的数据文本短、噪声大,多为对话,数据实时发生,需要基于时间和上下文的即时分析处理。如何实时、有效和经济地去访问和集成这些多语言的数据,是一个严峻挑战,目前的各种技术在准确性、可伸缩性和便携性方面都有所欠缺。

语义标注把语义模型和自然语言结合在了一起,可以看作是本体和非结构化或半结构化文档之间的关联进行双向动态的生成过程,从技术的角度来讲,语义标注是通过参照在本体里的URI的元数据, 从本体(类、实例、属性或者关系等)里标注在文本里出现的概念。使用文本里出现的新的实例去增强本体的方法也称为本体填充。

社交媒体的自动语义标引可以用于基于语义的搜索、浏览、过滤、推荐、可视化分析用户以及用户之间的社交网络和在线行为的语义模型建立,还有其他的应用场合例如知识管理、竞争情报、客户关系管理、电子政务、电子商务等。

目前的语义标注技术主要是针对新闻文章或者其他较为正式、篇幅较长的Web内容,由于社交媒体自身具有内容较短、噪声大、跟时间相关、用户产生内容等这些鲜明的特点,给语义标注技术的发展带来新的挑战。

2 社交媒体语义标注的方式

语义标注可以采用手工、自动化或半自动化等多种方式进行。

Passant等[1]提出了语义微博框架模型,以便用户给博文手动的添加机器可读的语义,该框架也支持通过主题标签与关联开放数据进行连接。Hepp等[2]提出了一个新的对微博进行手工语义标注句法,能映射成RDF语句,该句法支持标签、本体属性,例如FOAF和在同一个微博里多个RDF语句之间关系。尽管手工语义标注具有一定的价值,但是每天腾讯、新浪等百万条微博的涌现,亟需自动的语义标引方法。

信息抽取,作为一个自然语言分析的方式,日益成为在非结构化文本和在本体中的规范化知识之间建起沟通桥梁的关键技术。基于本体的信息抽取就是适用于语义标注的任务,传统的信息抽取和基于本体的信息抽取的一个显著区别就是规范化的本体作为系统的输入和输出,有些信息抽取系统只是把系统输出和本体做一个映射,这些系统严格来讲,应该称为面向本体的系统。基于本体的信息抽取另一个显著的特点是它不仅仅发现被抽取的实体的类型,而且还要把它跟目标知识库里的关于它的语义描述关联起来,通常用一个URI方式识别它,在抽取过程中需要在文档内和文档间进行命名实体、术语、关系等自动识别和共指消解。

关联开放数据资源,例如DBpedia,YAGO和Freebase等已经成为语义标注本体知识的关键来源,也作为用来消歧的目标本体知识库,他们提供了交叉引用、领域无关的数万条类和关系以及数百万条的实例,一个关联、互补的代名词的资源集合,对应于维基百科的条目和其他外部数据的概念和实例,丰富的类层次用于细粒度分类命名实体,而关于数百万实例和对应维基百科条目的链接的知识也是基于本体抽取系统的一个特点。

3 社交媒体语义标注的主要方法

3.1 关键短语抽取

自动抽取出的关键句可以表示出一个文档或文档集的主题,但不能有效的表达论点或者所有的观点,关键短语抽取因此被认为是一种浅表知识抽取,它也作为降维手段,允许系统处理较小集合的重要的术语而不是全文,用于上下文的语义标注和索引。

一些关键词语方法利用了术语共现形成术语的图,边为一对术语共现的距离,给顶点分配一定的权重,W Wu等研究表明这一类的术语抽取方法相对依赖于文本模型的方法,在Twitter数据上表现更优。这些基于图的方法在从Twitter中抽取关键短语之所以取得了良好的效果,原因在于这个领域包括了大量的冗余,有利于形成关键词摘要。但主题的多样性增加了抽取一系列相关和准确的关键词的难度,Xin等[3]在关键词组抽取中结合了主题建模来解决该问题。

当前的相关研究主要是使用该方法来产生新的标签,Qu等[4]在基于词性标签的基础上,从n-gram产生候选的关键短语,然后使用一个监督逻辑回归分类器进行过滤。该方法还可以和分众分类法进一步结合,产生标签签名,例如把分众分类法中的每一个标签和加权的、语义相关的术语联系起来,针对新的博文和帖子,进行比较和排序这些标签,从而推荐一些最相关的标签。

3.2 社交媒体中的基于本体的实体识别

基于本体的实体识别一般分为两个步骤:实体识别和实体联接,实体识别阶段主要根据一个本体识别出文本中出现的所有的类和实例,而实体联接阶段则是使用文本中的概念信息,结合从本体中的知识,来选择一个正确的URI。

3.2.1 基于维基百科的方法

目前实体识别和联接的主要研究都是使用维基百科作为庞大的、免费的、人工标引的训练语料库。典型的目标知识库例如DBpedia和YAGO等都是来源于维基百科,提供了一个实体URI和相应的维基百科页面的直接映射。

基于实体消歧的方法主要是使用一个字典,里面有每个实体URI的标签,包括维基百科的实体页面,重定向(用于同义词和缩写),消歧页(对具有相同名称的多个实体)和链接到维基百科页面时使用的锚定文本。这本词典用于识别所有候选实体的URI,然后把这些候选的URI进行排序,给出一个置信分数。如果在目标知识库里面,没有匹配的实体,就返回空值。

一个广泛使用的基于维基百科的语义标注系统是DBpedia Spotlight[5],这是一个免费的可定制的Web系统,它通过DBpedia的URIs标注文本,它的目标是DBpedia本体,包含了三十多个顶级类和272个类,通过显式地列出他们或一个SPARQL查询,来限制哪些类(或者它的子类)用于命名实体识别,这个算法首先通过查找一个来源于维基百科的URI词汇字典挑选候选的实体,然后使用向量空间模型对URI进行排序,每一个DBpedia资源都和一个文档相关联,构建的每一段文字里都使用到在维基百科里的概念。

LINDEN框架[6]在基于维基百科的信息外,还充分利用了YAGO里更丰富的语义信息,这种方法很大程度上依赖于Wikipedia-Miner工具,该工具用来分析有歧义的实体的上下文和发现出现在维基百科里的概念。在TACKBP2009数据集上的评测表明LINDEN超过了所有的只基于维基百科的系统,但目前LINDEN还没有和DBpedia Spotlight在同一数据集进行测试比较。

3.2.2 面向社交化媒体的方法

命名实体识别方法一般都是在较长、较常规的文本上进行训练,当作用在较短和更多噪声的社交媒体内容上的时候,效果较差。面向社交媒体的方法融合了语言和社交媒体专门的特性,尽管每个博文提供了很少的内容,但可以从用户资料、社交网络和回复中发现更多的附加信息。

Ritter 等[7]通过使用Freebase作为一个大规模已知实体来源,提出了命名实体分类的问题,如果没有考虑到上下文,直接进行实体查找和类型分配,只能得到38%的F值,其中35%的实体是歧义的,具有多个类型,而30%的实体没有在Freebase中出现过。如果使用被标记的主题模型,考虑到每个实体字符串出现的上下文和在Freebase类型上的分布,命名实体分类的F值提高到了66%。

Ireson 等[8]研究了在Flickr网站上命名标签的地名消歧问题。这个方法是在Yahoo! GeoPlanet语义数据库的基础上,为每一个地点实例都提供一个URI,与一个相关地点的分类,这个标签消歧的方法利用了其他分配给照片的标签,用户上下文(一个用户分配给他所有照片的标签)和扩展用户上下文(考虑到用户联系人的标签),这种基于社会化网络上下文的使用显著地提高了整体消歧的准确性。

另一个附加和隐藏的语义是微博里的主题标签,Laniado 等[9]详细调查了三千六百多万条微博里的主题标签语义,使用了四种度量指标:使用频率、使用的一致性、稳定性和专门性。这些度量用来决定哪些主题标签可以被用作标示符,连接到Freebase URIs上,通过从分众完成的在线词汇表,添加主题标签的定义,主题标签也可以作为语义信息的附加来源。Mendes等[10]通过简单地在DBpedia里查找,而没有进一步的消歧就完成了语义标注。用户相关的属性和社会关系都在FOAF里了,而语义标注通过MOAT本体来实现。

Gruhl等[11]关注了语义标注的消歧元素,审视了处理高度歧义的情况,例如歌曲音乐专辑的名称。他们提出的方法首先限制用于产生候选的MusicBrainZ本体的部分,通过过滤掉所有在给定文本里没有提到的音乐家的信息,然后运用词性标注和名词词组组块,把这些信息作为支持向量机分类器的输入,在此基础上进行消歧。这个方法对关于三位音乐家的MySpace帖子的语料集做了测试,尽管本体很大,但有关文本很快被找到,具有较高的效能。

3.2.3 商业化实体识别服务

现有大量的商业在线实体识别服务用实体标注文档,给文档指派关联数据URIs,NERD在线工具可以轻松地在用户上传的数据集上进行比较,还可以整合他们的结果,把结果映射到关联开放数据云上。

Zemanta[12] 是一个在线标注工具,最初专门用于博客和邮件内容,帮助用户通过推荐来插入标签和链接。Open Calais[13]是另外一个语义标注的商业化Web服务,Abel等利用它在新闻相关的微博里识别命名实体,目标实体一般是地理位置、公司、人员、地址或联系电话等,而被抽取出来的事件和事实一般涉及以上的实体,例如公司竞争者、联盟等。实体标注包括URL,允许通过http访问在关联数据中的这个实体的更多信息。目前OpenCalais连接到8个关联数据集上,包括它自带的数据库,如DBpedia,Wikipedia,IMDB等,广泛涉及到了本体中的实体类别。Calais的主要局限性是专有的性质问题,例如用户通过Web服务发送文档来进行标注,接受标注的结果,但是他们不能给Calais一个不同的本体来进行标注,或者定制实体抽取的方式。

3.3 情感监测和观点分析

自动情感监测技术主要分为基于词汇的方法和机器学习的方法,基于词汇的方法主要依赖于一个情感词汇库,包含了已知和预先收录的情感术语,而机器学习的方法利用浅表语法或语言的特性。大多数情感和观点分析方法没有或者很少利用到语义,例如把博文分为积极、消极或中性情感,是建立在n-grams和词性信息的技术上。这些方法会导致数据量少的问题。Saif等[14]证明了使用语义概念代替单词能显著提高极性分类的准确性,这个方法使用了AlchemyAPI来进行语义标注,它包括了30个实体类,绝大部分是人物、公司、城市和组织等。这个方法在斯坦福Twitter情感数据集上作了评估测试,性能超过了其他没有使用语义的现有方法。语义标注还可以用来完成挑战性的观点挖掘任务,结合来源于WordNet等上的情感词汇,使用基于规则的实体识别器来识别出微博里的人物、政治团体和所持观点,然后进行语义分析,使用模式来产生三语组,表示出观点持有者和投票意愿。

3.4 跨媒体联接

由于微博内容比较短,如果不参考外部资源的上下文内容,很难被理解,所以需要跨媒体的自动联接。Abel等把微博和当前的新闻故事连接在一起改善微博的语义标注的准确性,探索了一些联接策略:利用出现在微博里的URL,微博和新闻文章的TF-IDF相似性,主题标签和基于实体的相似性(例如OpenCalais识别出来的语义实体和主题)等。Hubmann-Haidvogel等[15]使用在线新闻从Twitter,YouTube和Facebook上汇总关于社交媒体关于气候变化的内容。

4 社会媒体的语义标注改进途径

目前的社交媒体语义标注方法有很多的局限性,很多方法就像关键词和主题抽取一样,只能解决浅表问题,而基于本体的实体和事件识别并没有取得在较长的文档上那样高的准确度和召回率。语义标注方法只适用于它们训练和评估的数据,在社交媒体标准数据集的训练算法也是有限的,使用命名实体类型和事件标注的微博条数一般都小于1000条,需要来自不同社交媒体类型更大的共享评测语料集,如果通过传统人工的方法进行,则不可能完成。

4.1 众包

一种改善自动标注的途径是进行众包,ZenCrowd[16]系统把大规模的实体和在Amazon Mechanical Turk上的微任务,能够自动连接到LOD云上的文字部分不交给标引员,只是在难以解决的情况下才咨询标引员,这样显著提高了标注结果。欧盟FP7资助的Xlike项目[17]也尝试众包去解决社交媒体广泛使用的非正式语言的非规则性,提高标注的准确性。Gate Teamware[18]是一个基于网络的协同标注工具,支持分布式团体工作,可以为非专业的标引员进行个性化定制使用。

4.2 利用Web of Data上的海量知识

另一种改善社交媒体语义标注的途径是更好的利用Web of Data上的海量知识,目前大部分局限在维基百科、DBpedia和YAGO上,使用网络数据的一大问题是,由于常用词和停用词的大量使用等造成的歧义,需要自动化的领域分类的步骤,确保特定领域的LOD(关联开放数据)资源被用于标引相关领域内的社交媒体。使用网络数据面临的第二大问题是健壮性和可伸缩性,在面临LOD资源的噪声知识时,在处理有噪音的、语法不规则的语言的时候,能保持一定的健壮性,考虑到Web of Data的规模,设计基于本体的算法时,算法要在维持较高的计算水平的同时,又能有效的加载和查询这些大规模的知识库。最后一个有效利用网络数据资源的障碍是相当有限的可用词汇信息。除了维基百科上的资源,其他的词汇信息大多数局限在RDF标签。这就限制了他们在基于本体的信息抽取和语义标注上的使用。近期很多学者都专注于利用协作完成的维基学科去建设跨语言词汇资源。它包含了很多外来词和新词,并且不断被贡献者社区进行更新,可以在分析用户内容时作参考使用。针对英语和德语,目前正在进行的工作有建立UBY[19],这是一个综合的、大规模、语义-词汇资源,它基于维基百科、WordNet和其他的LOD资源。有些研究还关注基于语言的本体建设,提出把语言信息和本体元素进行关联的模型,这些都为跨语言语义标注系统的建设进行了有益的尝试。

5 结语

尽管社交媒体的语义标注技术还有很多的改进空间,但语义标注的结果已经被应用在从社交媒体流的隐形信息中自动获得用户和社交网络的模型的方法上。为了更好的挖掘出隐含语义信息,处理多噪声的动态社交媒体流,我们需要探索更加稳定、准确的大规模实体和事件识别方法,需要进一步细化意见挖掘算法用于目标识别,解决时间波动性问题,对冲突意见的探测和建模以及意见汇总。

参考文献:

[1]A. Passant, J. G. Breslin, and S. Decker. Rethinking microblogging:open, distributed, semantic[C]. Proceedings of the 10th International Conference on Web Engineering,2010:263-277.

[2]M. Hepp. HyperTwitter: Collaborative knowledge engineering via Twitter messages[C].Knowledge Engineering and Management by the Masses-17th International Confe

rence EKAW 2010,2010:451-461.

[3]W. Xin, Z. Jing, J. Jing, H. Yang, S. Palakorn, W. X. Zhao,J. Jiang, J. He, Y. Song, P. Achananuparp, E. P. Lim, andX. Li. Topical keyphrase extraction from Twitter[C].Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies, HLT ’11,2011:379-388.

[4]L. Qu, C. Müller, and I. Gurevych. Using tag semantic network for keyphrase extraction in blogs. In Proceedings of the 17th Conference on Information and Knowledge Management,2008:1381-1382.

[5]Dbpedia Spotlight[EB/OL].[2013-06-02].http:///projects/dbp-spotlight/.

[6]W. Shen, J. Wang, P. Luo, and M. Wang. LINDEN: Linking named entities with knowledge base via semantic knowledge[C].Proceedings of the 21st Conference on World Wide Web,2012:449-458.

[7]A. Ritter, S. Clark, Mausam, and O. Etzioni. Named entity recognition in tweets: An experimental study[C]. Proc. of Empirical Methods for Natural Language Processing (EMNLP), Edinburgh, UK, 2011.

[8]N. Ireson and F. Ciravegna. Toponym resolution in social media[C]. Proceedings of the 9th International Semantic Web Conference (ISWC),2010:370-385.

[9]David Laniado and Peter Mika. Making sense of Twitter[C].International Semantic Web Conference(1),2010:470-485.

[10]P. N. Mendes, A. Passant, P. Kapanipathi, and A. P. Sheth. Linked open social signals[C]. Proceedings of the 2010 IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology, 2010:224-231.

[11]D. Gruhl, M. Nagarajan, J. Pieper, C. Robson, and A. Sheth. Context and Domain Knowledge Enhanced Entity Spotting in Informal Text[C]. Proceedings of the 8th International Semantic Web Conference (ISWC’2009), 2009.

[12]Zemanta[EB/OL]. [2013-06-03]. http://.

[13]Opencalais[EB/OL].[2013-06-03]. http:///.

[14]H. Saif, Y. He, and H. Alani. Alleviating data sparsity for Twitter sentiment analysis[C]. Proceedings of the #

MSM2012 Workshop, CEUR,2012.

[15]A.Hubmann-Haidvogel,A. M. P. Brasoveanu, A. Scharl, M. Sabou, and S. Gindl. Visualizing contextual and dynamic features of micropost streams[C].Proceedings of the #MSM2012 Workshop, CEUR, 2012.

[16]G. Demartini, D. E. Difallah, and P. Cudré-Mauroux. Zen-Crowd: Leveraging probabilistic reasoning and crowdsourcing techniques for large-scale entity linking[C].Proceedings of the 21st Conference on World Wide Web, 2012:469-478.

[17]Xlike[EB/OL].[2012-06-05]. http:///.

[18]Kaling Bontcheva, Hamish Cunningham, Ian Roberts, Angus Roberts, Valentin Tablan, Niraj Aswani, and Genevieve Gorrell. GATE Teamware: A Web-based, Collaborative Text Annotation Framework[J/OL]. [2013

-06-03].http://eprints.whiterose.ac.uk/75937/.