网易财经4月17日讯 2013国际量化投资高峰论坛今日举行,大智慧量化投资研究所所长钱滨生表示,市场的确朝着合理的估值模型靠拢,可以利用这样的关系做估值配对模式。
他称,首先对沪深A股找到估值模型,找到高估和低估的,根据模型选取高估和低估的,决定做多和做空的策略。
以下为访谈实录:
我本人在海外曾工作过一段时间,在主动型量化基金工作过,我所经历的一些事情基本是我自己的一些观感,今天介绍的也是基于我个人的理解,对国内交易市场的理解,某种程度上带有一定的偏见,如果在座的各位有更好的见解不妨可以提出,我们借助这个机会共同探讨,共同学习,希望能把中国这个投资市场做得更大更好。
我个人对量化在中国这个特定时代的意义,我觉得这是一个最好的时代,某种意义上也是一个最坏的时代,中国的强国梦实现在望,但也面临着金融危机不断恶化,还没有走出困境的时候,整个市场动荡不安,A股的走势波动非常大,这也体现了我们对量化投资的需求。宏观和监管对投资政策不断放宽,有新的投资需求,从三年前的股指期货、融资融券业务的创开,国债期货重新启动,这些好的对冲工具可以帮助我们做好风险控制,做出好的业绩,这对量化投资方式提供了大的背景、时代和舞台。刚才洪总裁已经讲了一些我们DTS大智慧平台能够为量化投资提供数据、交易模式的服务。
我们这个平台如何利用数据,挖掘服务进行金融产品的深化,我们不仅提供投资工具和数据,更多的会帮助投资者设计投资策略,投资模板或交流一些思路,这是我们量化投资研究所在下面一段时间需要努力和把量化投资深化的工作。
今天主要讲的是融资融券业务,市场上对融资融券比较常见的理解是针对配对交易,常见的配对交易是通过相关性来找到基本面相近的证券,做多一方和做空一方通过价差调整获取收益,中间配对的过程有些是基于协整,有些是基于统计学分析,有些是基于事件,常见的“黑天鹅事件事件”比如白酒的塑化剂事件出来之后大家做空这类股票,这样的交易方式可能是基于常见的理念,如果我们想把这个市场的业务做大,可以从量化角度丰富大家的策略思路,提供更多的交易方式。业务本身来讲,现在A股市场的发展已经非常迅猛了,而且融资融券业务开展三年来也扩大到500只标的。但从整个交易层面来讲,交易量还不是放得非常大,交易费用还是相当得高。最新的动态,可以发展的前景,比如说转融券业务正在试推行,交易门槛也在下调。把目前还是小众的业务拓展出来变成主流的业务,需要我们对投资机会有更多、更精准的把握。
我个人和团队针对市场做的研究
我们针对多因子模型发掘市场是不是对融资融券标的有估值偏差的可能,多因子模型对已经做量化投资的同仁不是很陌生,部分投资者不太了解。打个类比,市场上做证券投资就好像大家在房市上买房子,每个证券的定价要考虑多因素,房子在市面上的价格受很多因素的影响,作为房子会考虑地段、是不是学区房,朝向等因素对房子做多维度的刻划。股票价格来讲,可能从不同行业、盈利状况、财务质量、投资者都会有影响。做多因子模型某种程度上好像我们做了一个细致的市场调查,对所有的购房者做了一个问卷调查,直接说你在这个区域买两房一厅的房子,厅的面积多大,你愿意付多少钱,房子朝南愿意加多少钱,是不是学区房。
每个因素在市场上全方位的信息收集,相对你可以拿到可信度比较高,比较稳定的因子格局,如果把稳定因素、因子因素加在一起可以得到房市的价格,也可以得到证券在市场上基于多因子模型的估价,我们目前的估值是根据市场上风险比较高的估值因素做多估值模型,评估股票市场的价格。根据估值模型和市场价格会有差异,这就是估值偏差,我们在融资融券标的中,相对模型估值来讲相对高估或低估的股票,我们可以选择适合配备交易的股票,这是估值配对,通过多因子模型来做量化的想法。这样的估值模型是不是能做出来,而且是否具有合理性。
基于统计模型做A股市场定价的模型,这是统计模型的解释程度,越接近1,百分之百解释相对好,如果是1%就没有任何解释能力。(图)这个模型在很大程度上解释了市场上对不同证券价格上的刻划,这给了我们一定的信心,描述了市场对不同证券价格定价的区别,我们接着是不是可以根据这个模型做交易呢?这是一方面的因素,另一方面如果我们做配对交易假设,市场上如果估值有偏差,借助这个偏差做交易,最重要的核心点,所谓估值偏差会在一定时间之内修正,市场的假设就像之前迈克尔·卡沃尔讲的,不一定是非常有效的,我的假设是没那么强烈。我的假设是市场在大多数时对大多数股票定价是相当有效的,只是对于小部分股票部分时间定价不太充分有效,一定时间内市场会对估值进行修正,可能这就是建仓、平仓、获利的机会。统计学角度来讲,估值的偏差在一定时间内会出现修正的过程。我随机挑出200多只股票,每一期做多因子估值模型得出偏差度的值,根据这个偏差度在时间序列上做跨过预期,这个预期可能是一个月或一周估值偏差度相关性的情况,(图)左上角估值偏差度对这200多只股票来讲相关性非常得高,右下角相关度逐渐下降,第四个图相关度这个线已经突破了零点,说明历史上看估值相关度到一定程度会出现反转。高估的股票会在市场进行修正、估值合理回归。
这样的图示给我们建立了信心,市场的确朝着合理的估值模型做靠拢,我们可以利用这样的关系做估值配对模式。我们首先对沪深A股找到估值模型,找到高估和低估的,根据模型选取高估和低估的,决定做多和做空的策略。本来融资融券具有一定的杠杆,我们考虑了两种情况,一种是1.5倍的杠杆,这是基于保证金65%的水平,第二种是2倍的杠杆,这非常理想,达到了最低保证金50%的情况。这样简单的操作,选择高估和低估的5只股票做简单的组合,这只是展示,并不是实际操作,非常缜密的策略,这中间可能会涉及到风险的控制,止盈、止损,这是我们初步的设定,目前看来这个设定还是可以的,这个策略还是保持比较稳定的表现。最近也可以看到这个策略会有一定的波动,这也是我们在进一步研究和深化的工作。这样的策略,在股市大幅度波动和下调的过程还能保持正的增长,这是取得了20%的收益率。
各期收益率,并不是每期收益率都会为正,中间会有负的情况,这也反映我们的策略是基于统计学做套利的策略,长期获胜的过滤如果超过50%,你不停地玩策略游戏,长期来讲会获得稳定的收益。当然我们中间也会考虑风险收益的匹配,融资融券标的能否在券商那里获得。操作的事情在下一步的研究中我们会进一步进行探讨和分析。
这是比较不错的估值配对策略,中间有很多市场定价因素,这里有很多的数据,我们会不停地做数据挖掘,如果我们只针对还没有研究的数据进行挖掘,看能不能创造机会。另一个融资融券的策略,我们想根据分析师的目标价格因子来做策略。大家在软件里或做行情里会有分析师预期的数据,就是每股盈利的数据EPS,在报刊或里看到分析师的预期价格,这有一定的预测功能,但数据挖掘没有做太多的研究,这是我个人对国际相关数据的理解。如果价格是作为可实现的价格,对比今天的证券价格我们可以算成预期收益率(我称之为隐含收益率),这可能会反映股票未来价格的走势,如果我们做理论假想,结论是肯定的话,我们就可以作为操作策略,买入分析师预期上涨的股票,卖出分析师预期下跌的股票,这样就可以做出估值配对的策略。如果有分歧的话,那么分析师的价格观点对市场没有做贡献。
数据分析和挖掘其实要进行更多的研究,我们现在是进行数据挖掘的探索,中间有些数据未必直截了当,我们稍微进行细致的展示。(图)因子分析图,市场上每一个时点对A股全市场,我们根据分析师的预测价格隐含收益率做了排序,分为十组,由低到高,蓝线是最低隐含收益率,绿线是最高隐含收益率,然后看下一时段中累计收益率的表现,2006年我们开始做这个工作,这十条曲线反映了十组隐含收益率累计收益率的表现。最高隐含收益率的表现是最好的,最低的是比较差的,而且这个层次根据历史凸显来讲还是比较清晰的,似乎隐含收益率可以作为操作的因子,如果我们把多空组合作为配对交易,做成买最高的隐含收益率,卖最低隐含收益率,表现还是相当得不错。这是从大样本,长期来看隐含收益率目标,我们不可能买入所有隐含收益率的股票和卖出所有隐含收益率的股票,这涉及到流动性的问题,但这可以精准地把握,如果你最终选择了操作策略证券对象的话,数据质量有非常高的要求。我们展示的目标价格数据,实际操作中你会发现很多数据问题,这里面的数据问题有可能是一些人为的,比如数据输入的问题,也可能是分析师本人偏见的问题。
对于这一只股票来讲价格上限,从2011年12月份开始上线的价格基本在15元左右,但我红圈标出的价格会大大超越15元的价格范围,这说明数据存在一定的数据问题,或者分析师给出了一些不切实际的预测。(图)同样在价格上线,2007年10—11月之间,目标价格在10—11元之间,红圈标出来的数据会大大低于这个价格波动的区间,说明数据本身需要清洗,帮助我们用更合理的数据来做隐含收益率的计算。这是数据挖掘工作,我们对目标上线数据进行清洗,蓝线是浦发银行自己做的线性价格,红线是分析师给的目标价格,红线波动得非常大,反映一部分数据可能存在着问题。如果我做适当的清洗,清洗之后的绿线(数据)更接近蓝线,波动没有那么大,说明清洗起到了一定的效果。
把融资融券标的的股票分为五组,同样看成高隐含收益率组和低隐含收益率组的业绩表现的话,分成由低到高的五组,中间的分层并不是很清晰,这是用未经处理的分析师的目标计算的隐含收益率组,如果我们把数据进行清洗之后做出合理的筛选,不同组织建的收益率差别就会非常清楚。这显示的是数据清洗对于策略来讲效果的帮助。
要针对分析师的情绪偏见,像迈克尔·卡沃尔讲的人性总归是有弱点的,分析师做的价格预测有他自己的局限性和个人情绪上的波动导致目标价格给出的书记并不一定非常客观。这里涉及到可信度的问题,如果我们把不合理的数据,看起来有明显差异的数据进行清理,对数据可信度进行分析。我们对市场做了初步尝试,可信度的筛选,比如用统计模型发现分析师对目标价格偏见的程度。我们做这样的工作之后,如果做多五只高收益率、高信用率的股票,同时卖空低收益率,低信用率的股票,股票走势更平稳,多空组合如果持仓周期15天,尽管历史表现总数据最后比持仓10天要高,但中间波动程度比较大,这有可能反映市场的信心不断更新,而且更新的速度有可能在加快,在信息超过10天或者有新的目标价格更新,导致市场原先多空组合判断有负面效应,这是我们后面要进一步深入挖掘的东西,今天我们在这里只是做一个展示。大家可以从中看出,做量化投资包含了很多细致的工作,包括数据挖苦,策略效果分析和实践,我们希望抛砖引玉,希望能和在座各位日后做更深入的探讨。
我们会选择几种不同的策略在软件市场推出,我们希望发掘更多更好的策略,帮助市场金融创新发展,和大家一起努力,创造中国量化投资的新时代。谢谢大家!