当前位置: 首页 精选范文 金融投资量化方法范文

金融投资量化方法精选(五篇)

发布时间:2023-10-10 15:35:08

序言:作为思想的载体和知识的探索者,写作是一种独特的艺术,我们为您准备了不同风格的5篇金融投资量化方法,期待它们能激发您的灵感。

金融投资量化方法

篇1

中国金融业飞速发展,尤其是2010年股指期货的推出,量化投资和对冲基金逐步进入国内投资者的视野。目前,量化投资、对冲基金已经成为中国资本市场最热门的话题之一,各投资机构纷纷开始着手打造各自量化投资精英团队。同时,中国拥有数量庞大的私募基金,部分私募基金利用国内市场定价较弱的特性转化成对冲基金也是必然的趋势。

量化投资是将投资理念及策略通过具体指标、参数的设计,融入到具体的模型中,用模型对市场进行不带任何情绪的跟踪;简单而言,就是用数量化的方法对股票估值,选取适合的股票进行投资。

量化投资的鼻祖是美国数学家西蒙斯(James Simons)教授,从1989年到2006年间,他管理的大奖章基金平均年收益率高达38.5%,净回报率超越巴菲特。

对冲基金(hedge fund)是指运用金融衍生工具,以高风险投机为手段并以盈利为目的的金融基金,采用各种交易手段(卖空、杠杆操作、程序交易、互换交易、套利交易、衍生品种等)进行对冲、换位、套头、套期来赚取巨额利润。

犹抱琵琶半遮面

上海交通大学金融工程研究中心陈工孟教授表示,2010年股指期货推出后,量化投资和对冲基金渐成热门话题,并正在逐步萌芽和发展,但因为是新事物,社会各界还不是很了解。

目前国内约有12只公募量化基金,而深圳和上海也已有不少对冲基金;量化投资和对冲基金离中国投资者如此之近,但又是如此神秘。

长期以来,国内投资者一直存在着一些疑问,例如,量化投资和对冲基金是不是金融业发展的必然?量化投资和对冲基金对金融安全问题会产生什么影响?上海建设国际金融中心,量化投资和对冲基金应该扮演怎样的角色?量化投资和对冲基金为何能取得超额收益?量化投资和对冲基金如何进行规范和监管?对冲基金如何募集、运作和壮大?如何开发策略、如何进行交易如何控制风险?

对于上述问题,国内缺乏进行深度探讨和专业研究的有效途径。近日,国内领先的量化投资和对冲基金专业研究机构,上海交通大学金融工程研究中心主办了2011第一届中国量化投资高峰论坛。众多国际投资家、知名学者、优秀对冲基金经理、量化投资领军人物、交易所研究代表等,与300多位来自于证券、基金、私募、信托、银行、保险界的专业人士、信息技术服务商和民间资本代表,共同分享最新的量化投资和对冲基金的宏观视点及微观技术,以解决金融业发展迫切需要解决的问题。主办机构表示:“我们相信此次高峰论坛的召开,将开创中国量化投资和对冲基金的新纪元。”

无限风光在险峰

上海交通大学安泰经济管理学院院长周林教授在论坛致辞时表示:“通过引进各种各样的产品、各种各样的金融工具,特别是量化投资的方法,逐渐把过去的投资艺术转化到投资科学,这是我们共同关心的问题。”

周林认为,在中国开展量化投资、设立对冲基金将来有可能的空间,当然,可能也会有问题和风险。即使像美国、英国这样的成熟市场也会产生风波,比如金融危机,不能归咎于量化投资、对冲基金,但一些投资手段、金融工具运用不好,也可能对市场带来一些风险。“对于一系列未来可能产生的问题,我们一定要做非常好的分析。”

中国金融期货交易所副总经理胡政博士谈到,由于量化投资导致程序化交易和国外流行的算法交易等,这些新的交易方式是市场发展的基本趋势。通过研究后他认为,有四方面问题值得关注。

第一是对市场公平性的冲击。有人用“大刀长矛“,有人用“导弹、机关枪”,有专家理财,有一般的投机炒家,各种各样的风格构成了市场,投资手段的不平衡,有可能会带来市场交易的不公平。

第二,对市场本身运行的冲击。量化投资的产品,有可能会对市场价格造成冲击。当采用类似的风险止损点或者类似理念时,市场发生某个方向的变动,有可能加剧这种变化。

第三,对市场价格信息的冲击。很多量化投资工具需要收集信息,需要有很多试探性的报价去测市场的深度。大量的试探性报价,不以成交为目的的报价信息,会对市场产生冲击和影响。

第四,对交易系统的冲击。量化投资快速发展的核心因素是计算机技术的发展,现有交易系统都基于计算机系统,各种各样的工具会对交易系统造成冲击。

第一财经传媒有限公司副总经理杨宇东建议,希望媒体把目前机构、专家学者、管理层正在研究的成果报道出来,让更多的人了解;他还呼吁更快地完善有关对冲基金方面的监管政策和法规,并给予量化投资更多的扶持和技术支持。

上海银监局副局长张光平探讨了人民币国际化的话题。湘财证券副总裁兼首席风险官李康的观点鲜明生动,而中国社科院研究员易宪容在演讲时则激情四溢。

韶华休笑本无根

量化投资把资本市场的投资行为从以往定性化的“艺术”升华为数量化的“科学”,运用到高深的数量工具。国外从事量化投资的研究人员和基金经理大多是学金融、计算机和统计学出身,很多物理、数学专业等理工科背景的优秀人才也加入这一行列。野村证券亚太区执行总监周鸿松就是哈佛大学空间物理博士,曾获2011亚洲银行家峰会最佳算法交易系统团队奖。

在美国留学获计算机硕士的刘震现任易方达基金管理公司指数与量化投资部总经理,1995年进入华尔街工作,在与国内父母通电话时,他感到很难解释清楚自己的职业性质,便说跟“投资倒把”差不多,这可把他父母给弄晕了。

国泰君安证券资产管理公司总经理章飙是统计学博士,早在2006年就开始用量化投资工具做ETF套利,最初很难被上司和同事理解,直到做出几个成功案例后,才有了较大的发言权。他曾向公司申请投5000万元做“攀钢钢矾”,还放出“狠话”:如果公司不让做他就辞职,两年后这笔投资为公司赚了3.5亿元。

篇2

记者:量化投资有什么特点?

刘钊:量化投资的主要特点是买入、卖出股票,不再是由人的主观判断做出决定,而是由量化模型决定。量化投资是一套科学的方法,有严格的分析、计算,什么好什么不好,不是我们自己说了算,是数据和模型说了算。即使是简单的低市盈率投资方法,只要能严格执行,就能取得超额收益。

记者:排除了人为主观情绪的影响,但由量化模型控制的量化投资基金的收益会如何呢?

刘钊:我们可以看看美国最成功的量化投资大师――詹姆斯・西蒙斯管理的大奖章基金,在1989年―2006年的17年间,大奖章基金平均年收益率达38.5%,而股神巴菲特过去20年的平均年回报率也不过20%。正是鉴于量化投资的巨大威力,摩根士丹利华鑫基金公司经过两年的精心准备,推出了国内真正意义上的量化投资基金――大摩华鑫多因子基金。

记者:量化投资的成败,关键在哪里?

刘钊:普通投资者买卖股票,主要是基于政策、基本面、市场、技术等各种信息和经验来做出交易决定,这些因素属于主观判断,而且往往容易受到情绪的影响。量化投资是将投资思路通过设定的指标、参数体现在量化模型上,通过计算机系统自动买卖股票,因此,量化投资的关键点就在于建立一个好的量化模型。

记者:量化投资和价值投资冲突吗?

刘钊:说到投资,大家首先想到的是巴菲特的价值投资,从长期的历史实践看,价值投资确实比较有效,量化投资也可以建立价值投资类的模型。

举例来说,衡量价值投资的最重要指标是低市盈率,如果以市盈率为标准来建模,以2005年5月为时间点,按市盈率对所有上市公司排序,再按市值比例模拟买入市盈率最低的100只股票,第二年5月,重新计算市盈率最低的100只股票,并调整组合,如此重复,每年调整一次仓位。得到的结果是,从2005年5月至2010年5月,沪深300指数的年化收益率为25.4%,同期量化建模的低市盈率策略基金的年化收益率达到29.46%,与沪深300指数相比,低市盈率策略基金的超额收益为4.06%。以此为基础,再以预期市盈率为基础建立一个模型,并模拟买入当年预期市盈率最低的100只股票,量化模型的年化收益率有36.51%。

记者:大摩华鑫的量化投资模型有何成功之处?

刘钊:大摩华鑫量化投资的模型既有一些过去历史上证明非常有效的投资方法,比如价值投资,也有投资管理团队的支持,大摩华鑫资深基金经理多年的投资经验也为大摩华鑫的量化模型提供了一些思路。此外,我们还通过外方股东摩根士丹利以及通过数据挖掘的方法,找到一些好的投资策略,为建模提供思路和方法。

篇3

本刊记者专访了建信责任ETF、建信社会责任联接基金经理叶乐天,为我们揭开量化投资的面纱。来自浙江,北大数学系出身的叶乐天,谈起量化投资,如数家珍。在他看来,量化投资与基本面投资在方法论上有较大差别。后者类似中医,通过实地调研考察,望闻问切,接触病人,获取信息,加以判断;前者则把影响投资的各方面情况以及投资逻辑转化为数据和模型,类似西医,用医疗设备对病人进行体检和化验,更重视借助图表和数据对病人的病情做出判断,因此能做到不见病人而对其基本特征了如指掌。

:请通俗介绍一下什么是量化投资,它的发展情况如何?

叶乐天:中国量化投资研究院院长陈工孟曾做过这样的描述:第一批聪明人叫金融学家,他们发明了各种各样的金融衍生品赚得盆满钵满;第二批聪明人叫数学家,他们通过各种数据模型去发现了一些不合理的现象,同时发现了赚钱的机会,然而数学家不知道怎么把钱赚到手;第三批聪明人就是IT工程师、软件工程师,他们帮助第二批聪明人实现了赚钱的机会。而“量化投资”就是高端的金融人才、数学家和一流的IT工程师的复合。在美国有一种说法,最聪明的人,最高端的技术首先应用在两个领域,一个领域就是国防,第二个领域就是华尔街。

量化投资从20世纪70年代在美国兴起,经过40多年的发展,已经成为西方金融市场最为重要的投资方式之一。从20世纪90年代初期开始,量化投资的资产管理规模迅速增长,2000~2007年,美国的量化投资总规模增长了4倍多。2011年美国的量化投资和对冲基金的规模经过金融危机以后再创新高,达到了2万多亿美元的规模。

2009年被称为中国量化投资元年。随着2010年股指期货的推出,金融衍生品迅速登上中国资本市场的舞台,为量化投资的发展创造了有利的条件,而量化投资的发展为投资者提供了可选择的、非常有优势地位的投资方式。

:量化投资与价值投资有什么关系?

叶乐天:资本市场之大,每位强者都有自己的成功之道。相对于巴菲特过去20年平均20%的年回报率,有位中国人不太熟悉的高手更胜一筹,他就是华尔街的“模型先生”詹姆斯·西蒙斯。西蒙斯创办的大奖章基金从1989年到2006年的平均年收益率高达38.5%,净回报率超过巴菲特,即使在次贷危机爆发市场一片阴霾的2007年,他的基金回报都高达85%。

与股神巴菲特的“价值投资”不同,西蒙斯的投资成就依靠的是“量化投资”。这位24岁起就出任哈佛大学数学系教授的数学天才,依靠数学模型和计算机技术捕捉着市场机会。他认为,数学模型比主动投资能够更有效地降低风险。虽然中国人对西蒙斯这个名字还比较陌生,但量化投资产品在华尔街已经非常普遍。

:为什么说量化投资像西医?

叶乐天:随着计算机运算速度的提高,华尔街的量化投资已经发展到争取几毫秒的机会。同一个套利机会下,谁下单早,谁就能抓住机会。尽管大家争取的可能是万分之一的收益,但是通过每天大量的交易,日积月累,就能取得很高的回报。

与市场熟悉的定性投资相比,量化投资在研究方法上与其有着很大不同。定性投资主要通过公司基本面研究进行投资决策。需要基金经理到企业调研,看研究报告,与高管深入交流、了解大股东诉求,了解公司发展规划之类,有深度。量化投资则注重广度,比如市场上有2000只股票,量化投资会通过计算机比较2000只股票的数据,找出上涨个股共同的特征因子进行投资。与定性投资产品的基金经理经常出差不同,我主要的工作都在案头——搜集数据,处理数据、还有编程。

定性投资和定量投资的差异如同中医和西医的关系。定性投资更像中医,更多地依靠经验和感觉判断病在哪里;定量投资更像西医,依靠模型判断,模型对于基金经理的作用就像CT机对于医生的作用。

:如何选择量化投资产品尤其是指数基金?

叶乐天:目前,量化投资在中国公募基金市场的形态还比较简单,主要可以分为被动型的和主动型的。被动型的量化产品包括了大量的指数基金;主动型的量化产品则主要有3种模式,分别是“多因子型”、“事件型”和“宏观择时型”的。事件型和宏观择时型相对容易理解。多因子型,就是通过比较数据,筛选出个股走势变化的关联因子,然后,在未来个股走势出现类似因子时,触发交易,从中取得收益。

在公募产品中,以指数型产品为主,主动量化的产品数量稀少。公募基金受制于交易监管规则,比如在同一天的交易中,不能对同一标的做反向交易,在衍生品工具的使用上也非常有限,所以做主动量化的产品较少。同时,量化投资不像定性研究,对单个公司研究得很透,经得起很大的波动,追求的涨幅也大。量化投资通常追求很小的涨幅,但业绩比较稳定。而且,历史上指数基金的业绩表现还算稳定,主动量化基金产品的稳定性稍差,而业绩稳定对开放式基金更加重要。此外,市场深度不够也制约了量化产品在中国的发展。公募基金的规模通常比较大,如果做主动型的产品,更换持仓的冲击成本就比较大。

不过,对于普通投资者而言,要投资量化基金时,并不是非要弄懂基金的运作模型。选择一只量化产品与选择普通的基金产品,方法并没有太大的差异。首先,投资者需要了解量化产品的过往业绩,如果基金持续一段时间业绩表现优秀,说明这种模型相对来说是较为可靠的。其次,就是看基金经理的投资理念和思路方法投资者是否认可,因为基金经理正是模型的制定者。最后应当考虑个人整体的资产配置,从长期的角度对基金产品进行合理配置,不用过多地顾虑投资时机。

篇4

【关键词】量化投资;数学

中图分类号:F83 文献标识码:A 文章编号:1006-0278(2014)07-242-01

一、量化投资概述

量化投资,顾名思义,将投资进行量化。它结合数学模型、利用计算机相关的科学技术对投资进行决策。与传统的投资方式不同,它不依靠人的主观意识去判断决策,而是通过量化模型处理大量信息以便找到一定的市场规律。

量化投资的发展史就短短的几十年,但其凭借其纪律性、系统性、及时性、准确性和分散化的优势,发展前景十分可观。其主要研究内容包括算法交易、股指期货套利和量化选股等投资策略,以数据挖掘、人工智能和随机过程等理论进行分析最终得到决策方案。A股市场的弱有效性,使其特别适合通过量化的方法找出其无效性,发掘出超额收益的潜力。

二、数学模型的重要性

“数学模型”,又称“金融数学”或“数理金融学”,是利用数学工具研究金融现象,通过数学模型进行定量分析,以求找到金融活动中潜在的规律,并用以指导实践。金融数学是现代数学与计算机技术在金融领域中的结合应用。

金融数学的发展曾两次引发了“华尔街革命”。上个世纪50年代初期,马克维茨提出证券投资组合理论,第一次明确地用数学工具给出了在一定风险水平下按不同比例投资多种证券,收益可能最大的投资方法,引发了第一次“华尔街革命”。马克维茨也因此获得了1990年诺贝尔经济学奖。1973年,美国金融学家布莱克和舒尔斯用数学方法给出了期权定价模型,推动了期权交易的发展,期权交易很快成为世界金融市场的主要内容,成为第二次“华尔街革命”。2003年诺贝尔经济学奖第三次授予以数学为工具分析金融问题的美国经济学家恩格尔和英国经济学家格兰杰,以表彰他们分别用“随着时间变化易变性”和“共同趋势”两种新方法分析经济时间数列给经济学研究和经济发展带来巨大影响。

不仅仅是理论界在金融数学领域取得巨大的成就。实务投资派也运用金融数学模型在市场中取得了巨大的盈利。数学教授出身的“模型先生”詹姆斯・西蒙斯(James Simons)连续两年在对冲基金经理人收入排行中位列第一。2005年,西蒙斯成为全球收入最高的对冲基金经理,净赚15亿美元,去年,他收入高达17亿美元,差不多是索罗斯的两倍。68岁的西蒙斯是世界级的数学家,也是最伟大的对冲基金经理之一。他24岁就出任哈佛大学数学系教授,曾与著名华裔数学家陈省身一同创立了Chern-Simons几何定律,该定律成为理论物理学的重要工具。西蒙斯和他的文艺复兴科技公司是华尔街一个彻底的异类,公司从不雇用华尔街人士,而是靠数学模型捕捉市场机会,用电脑作出交易决策,是这位超级投资者成功的秘诀。

而在量化投资学中,数学模型有着举足轻重的作用。依靠个人判断选股,你可以一夜暴富,但是同时你也承担着第二天输得什么都没有的风险,模型的优势恰恰在于降低风险。举个例子,传统的定性投资依赖于上市公司的调研,结合了个人的经验和主观判断,而无法克服人性上贪婪、侥幸心理和恐惧等弱点,带着个人情感会使是判断产生偏差。模型恰恰能通过全面系统性的扫描,准确且客观地评价交易机会,克服了主观上的情绪导致的偏差,从而做到降低风险。投资能盈利的本质就在于能有效的控制风险。风险是一定存在,但只要能合理控制,即能找到商机。

三、论述数学在股市中的应用

(一)时间序列下用R/S分析法对股市收盘的预测

R/S分析法由水纹专家H.E.Hurst在1951年提出的,其旨通过数学公式计算出该序列的H值,并根据H值来判断序列的走势。H值和相应的时间学列分为3中类型:

(1)H=0.5时,时间序列是随机游走的。序列中的不同时间的值是随机的和不相关的,即市场是有效的。

(2)当0.5≤H

(3)当0

根据R/S分析法,可将要分析的股票的收盘数据导出,计算出各项指标,根据H值来预测收盘的走势,对投资决策有重大意义。

(二)多因子选股模型

多因子选股模型是一类重要的选股模型。较稳定,是综合很多市场信息最后得出的选股结果。通常有两种办法:打分法和回归法。在此介绍回归法在选股中的应用。

回归法根据过去的股票的收益率的值对多因子进行回归最终得到回归方程。再将新因子的值带入回归方程,得到的值即为对未来股票的收益的一个预判,可根据这个预判进行选股。

篇5

【关键词】机器学习 量化投资 三因子模型

一、引言

作为人工智能领域主要的研究方向之一,机器学习无疑最受瞩目。尤其是近几年深度学习方法在语音识别、自然语言处理、自动驾驶等方面取得了巨大的成功,使得各行各业都将机器学习方法做为重点的研究方向。特别是在金融领域,以机器学习为主的人工智能已经在量化投资方面得到了广泛的应用。机器学习可以快速海量地进行分析、拟合、预测,人工智能与量化交易联系越来越紧密。如全球最大的对冲基金桥水联合(Bridge water Asspcoates)在2013年就建立了一个基于机器学习的量化投资团队,该团队设计交易算法,利用历史数据预测未来金融市场变化,以人工智能的方式进行投资组合调整。日本的人工智能量化投资公司Alpaca,建立了一个基于图像识别的机器学习技术平台Capitalico,通过该平台,用户可以利用数据库中找到外汇交易图表进行分析,这使得普通投资者也能知道成功的交易员是如何做出交易决策的,从他们的经验中学习并作出更准确的交易。然而在金融领域,已公开的有效的预测模型是基本不存在的,因为无论是机构投资者还是个人投资者一旦公开投资模型,也就意味着投资模型的失效。比如著名数学家西蒙斯1988年成立的文艺复兴公司,就完全依靠数学模型进行投资,公司旗下从事量化投资的大奖章基金回报率也远超过其他对冲基金,然而该公司却从不公开投资模型。虽然金融机构很少公开如何利用机器学习来指导投资的研究成果,但学术界对机器学习在金融投资中的应用的研究却在逐渐增加。

支持向量机(support vector machines,SVM)是Vapnik 1995年提出的新的机器学习算法,该方法有很好的泛化能力,一种非常成功的机器学习方法,性能明显优于传统神经网络。在金融研究领域,支持向量机也是应用最广泛的机器学习模型。即使在国内,利用SVM方法的研究文献也不少。赛英(2013)利用支持向量机(SVM)方法对股指期货进行预测,并用遗传算法(GA)和粒子群算法(PSO)分别优化四种不同核函数的支持向量机,通过大量实验发现,采用粒子群算法化的线性核函数支持向量机对股指期货具有最好的预测效果。黄同愿(2016)通过选择最优的径向基核函数,再利用网格寻参、遗传算法和粒子群算法对最佳核函数参数进行对比寻优,构建最有效的支持向量机模型,并对中国银行未来15日的开盘价格变化趋势进行预测,并认为用支持向量机来预测股票走势是可行的。程昌品(2012)提出了一种基于二进正交小波变换和ARIMA-SVM方法的非平稳时间序列预测方案。用高频数据构建自回归模型ARIMA进行预测,对低频信息则用SVM模型进行拟合;最后将各模型的预测结果进行叠加,并发现这种办法比单一预测模型更加有效。张贵生(2016)提出了一种新的SVM-GARCH预测模型,通过实验发现该模型在时间序列数据去除噪音、趋势判别以及预测的精确度等方面均优于传统的ARMA-GARCH模型。徐国祥(2011)在传统SVM方法的基础上,引入主成分分析方法和遗传算法,构建了新的PCA-GA-SVM模型。并利用该模型对沪深300指数和多只成分股进行了验证分析,并发现该模型对沪深300指数和大盘股每日走势有很好的预测精度。韩瑜(2016)结合时间序列提出了一种基于GARCH-SVM、AR-SVM的股票涨跌预测方法,结果表明,加入GARCH或AR等时间序列模型的初步预测结果可以提高SVM预测准确率。

从国内的研究文献来看,大多数文献都是通过机器学习方法来优化传统的时间序列预测模型,很少去研究如何通过机器学习方法构建有效的量化投资策略。由此,本文将利用SVM算法,结合经典的Fama-Fench三因子模型,设计量化投资策略,探讨机器学习方法在金融投资领域应用的新思路。

二、模型理论介绍

(一)Fama&Fench三因子模型

Sharpe(1964),Lintner(1965)和Mossin(1966)提出的资本资产定价模型(CAPM)是一个里程碑。在若干假定前提条件下,他们严谨地推导出了在均衡状态下任意证券的定价公式:

式中,E(ri)是任意证券i的期望收益率,E(r0)是无风险利率,E(rm)是市场组合(market portfolio)的期望收益率。■。法马(Fama,1973)对CAPM进行了验证,发现组合的β值与其收益率之间的线性关系近似成立,但截距偏高,斜率偏低,说明β不能解释超额收益。之后,Fama&Fench(1992)详细地分析了那些引起CAPM异象的因子对证券横截面收益率的影响。结果发现,所有这些因子对截面收益率都有单独的解释力,但联合起来时,市值和账目价值比(BE/ME)两个因子在很大程度上吸收了估计比值(E/P)以及杠杆率的作用。基于此,Fama&Fench(1993)在构建多因子模型时,着重考虑规模市值(SMB)和账面价值比(HML)这两个因子。因此,三因子模型可以写为:

(二)支持向量机

支持向量机是一种二分类模型,也可以用于多分类,它的基本模型是定义在特征空间上的间隔最大的线性分类器,通过寻求结构化风险最小来提高分类器的泛华能力,实现经验风险和置信范围的最小化,最终可转化为一个凸二次规划的问题求解。支持向量机是90年代最成功的机器学习方法,它的基本思想是求解能够正确划分训练数据集并几何间隔最大的分离超平面,该超平面可以对数据进行分类,分类的标准起源于逻辑回归,logistic回归的目的是从特征学习出一个0/1分类模型,logistic函数(sigmoid函数)的表达形式为:

这个模型是将特征的线性组合作为自变量。由于自变量的取值范围是负无穷到正无穷,因此,sigmoid函数将自变量映射到(0,1)上,对应的类别用y来表示,可以取-1或者1。根据输的概率对数据进行分类,sigmoid函数图像如图1。

支持向量机也是利用上述分类原理对数据进行分类,如图2所示,wTx+b=0为n维空间的一个超平面,该超平面将数据分开,一般来说,一个点距离超平面的远近可以表示为分类预测的准确程度。支持向量机就是求解■的最大值,也就是说,构造最大间隔分类器γ,使两个间隔边界的距离达到最大,而落在间隔边界上的点就叫做支持向量,明显有y(wT+b)>1。

当数据不能线性可分时,就需要利用非线性模型才能很好地进行分类,当不能用直线将数据分开的情况下,构造一个超曲面可以将数据分开。SVM采用的方法是选择一个核函数,通过将数据映射到高维空间,在这个空中构造最优分类超平面,用线性分类法进行数据分类。

然而,在不知道特征映射的形式时,很难确定选择什么样的核函数是合适的。因此,选择不同的核函数可能面临不同的结果,若核函数选择不合适,则意味着将样本映射到了一不合适的特征空间,很可能导致结果不佳。常用的核函数见表1。

三、实证分析与应用

(一)数据说明

训练数据为2012年8月1日至2016年8月1日沪深300成分股在每月最后一个交易日有交易的股票因子值,市值因子SMB(marketValue)和账面价值比HML(PB)比这两个因子见表2,所有因子数据都通过标准化并处理。利用PB和marketValue两个因子,预测下月该股票的涨跌,利用机器学习中的支持向量机进行训练,数据特征为月度股票因子,训练标签为该股票下个月月初第一个交易日的涨跌,上涨为1,下跌和股价不变标记为0,采用交叉验证方法,其中80%的数据为训练集,20%的数据为测试集,利用R语言中的e1071包进行分析。

表2 因子名称与因子说明

(二)策略回测

从实验结果看,SVM的测试集预测准确率为62.32%,回测策略为等权重买入当月预测上涨概率排名前20的股票,每月初第一个交易日进行调仓,回测区间共调仓41次。回测区间为2013年7月1日至2017年2月28日,初始资金设为1000000元,利用优矿量化平台进行回测,策略回测的部分持仓记录见表3,策略效果见图3和表4。

表3 策略回测持仓记录

图3 策略收益率与基准收益率对比

表4 模型回测结果主要数据

由于多因子模型通常为稳健策略,因此为了避免频繁交易带来的高额交易费用,本策略采用了月度定期调仓的手法。从表3,图3和表4的策略回测结果来看,利用支持向量机算法结合Fama-Fench三因子模型设计的交易策略,在回测区间年化收益率为22.4%,超越了13.4%的基准市场收益率,获得了8.2%的阿尔法,这也说明Fama-Fench三因子模型在A股市场依然有效。同时我们也能看到,该策略最大回撤为48.1%,说明在不加入止损、止盈条件下,该策略并不能实现很好的对冲效果。从量化投资的角度来看,利用股指期货进行对冲,是多因子策略的一个很好的选择。

四、结论

本文通过利用机器学习中的经典算法支持向量机并结合Fama-Fench三因子模型构建了量化投资策略。通过市值因子和市净率因子,利用机器学习算法,滚动预测下一个月股票的涨跌方向。实验结果发现,支持向量机的预测准确率达到了62.23%,通过预测股票涨跌方向的概率,设计了对应的投资策略,该策略在回测期间的年化收益达到了22.4%,远超过基准年华收益率的13.4%。本文的研究表明,机器学习方法在金融市场有很好的运用空间,在大数据时代的今天,传统统计模型无法从复杂、多维的金融数据中提取出有效的信息特征,而机器学习算法擅长处理复杂、高维数据。这也是人工智能投资在金融行业越来越受到重视的原因。从量化投资这一角度来说,如何将机器学习方法应用到金融投资领域还是一个饱受争议的话题,本文只是从尝试的角度出发,创新的将机器学习方法结合经典的Fama-Fench三因子模型来验证对中国股市的投资效果。而如何将机器学习方法应用到更多的金融投资领域将是本文下一阶段的研究重点。

参考文献

[1]Cortes C,Vapnik V.Support-Vector Networks.[J].Machine Learning,1995,20(3):273-297.

[2]Fama,E.F.&K.R.French(1992),“The cross-section ofexpected stock returns”,Journal of Finance 47:427-466.