摘要:股票量化投资的门槛很高,期货量化投资的门槛其实很低,谁都可以做,你要真正想做一个股票的量化策略,投入会非常大,而且不是那么容易能做出来。股票量化策略的难点比较多,第一个难点在数据处理上,第二个难点在模型的建立上。
“光大乌龙指事件”如果从公开信息上来说,它可能是风控系统出了问题,主要原因还是在风控机制的问题。这个事情给我们的反思就是:第一市场如果出现别人做这种事情我应该怎么应对;第二个就是像骑士资本这样,我的软件出了问题我应该怎么应对;第三个问题就是像长期资本这样,我的模型可能出现问题,我该怎样做资金的风险管理;大概是从这几个角度去做。
量化投资从股指期货开始算是一个初始期,未来还有10-20年的高速发展,现在还是混战期,数年后会进入三国时代。这三年大家都不是在竞争,都是在修炼,很多都是为了三年以后做准备,包括人才、资金储备、渠道、技术。量化其实是对价值投资的一个有效的补充,不同维度的竞争还没有到。
股市机会比期市大 股票量化几大难点
私募排排网:你们的投资品种是商品期货还是股指期货?
陈曦:目前第一步所有的策略都是在商品和股指期货上,第二步我们会做股票的阿尔法策略,就是股票和股指期货对冲的产品或者市场中性策略。
接下来会发一只结构化对冲的产品,主要是用在股票和股指期货的量化模型,因为对冲交易的容量比较大,单纯期货投机的容量不是很大,据我们感觉可能管到2-3个亿会达到一定的瓶颈,但股票的话管到10-20个亿都没太大问题。
私募排排网:您认为在中国做量化,股市和期市方面,股票的未来的空间更大一些?
陈曦:一定的。股票量化的公司在全世界来讲,做的好的公司有200-300亿的规模,而期货的竞争比较强,做的人变多的话,可能赚钱会变得比较难。期货市场现在大概有10%的资金在做程序化交易,股票可能连1%都不到。
股票的门槛很高,期货的门槛其实很低,谁都可以做,但是你要真正想做一个股票的量化策略,投入会非常大,而且不是那么容易能做出来,我们还是想在股票上做大一些,期货只是市场的切入点。
私募排排网:那您觉得股票量化要想做好的话,主要的难点是在哪里?
陈曦:股票量化策略的难点比较多,首先从标的上来说,期货是一个连续交易的品种,但是股票的标的有2000多只。在数据的获取上,期货的数据其实已经非常公开了,股票的数据其实没有那么公开。首先你要得到这些数据就很不容易,然后还要自己处理数据,现在报价过去十年的数据大概要十几万,而且这十几万还买不到很好的,还需要自己鉴别和处理。处理数据方面,第一你要把停牌的日子挑出来这些不能买;第二涨跌停的要过滤掉;第三要把除权的数据做复权处理。能够把数据全部处理好这个门槛,已经挡掉50-60%的想进入股票量化投资的人,他们无法做到这一点。但期货有免费已经处理好了的连续数据,所以股票第一个难点在数据处理上。
第二个难点在模型的建立上,期货的模型主要是择时模型,择时就只交易这个合约,比如说股指连续,不用去选品种,股票的话,选品种的维度就特别大。像数据库,期货只有一个数据库就是时间序列,股票是二维的,时间跟2000多只股票全部搭配下来,选股的时候,数据处理量非常非常大,所以选股模型是一个非常复杂的东西。
像现在一般主流的模型叫多因子模型,它的选股就是纯统计的东西,第一步就是找因子,做显著性分析,然后找出相关性高的和比较显著的因子。第二步,假设你找出来30个因子都有能够给你贡献正的期望,但是怎么把这30个因子按什么权重来做,这又是一个很复杂的过程。
第一步我们可能用到主成分分析法去进行筛选过滤,把因子减少;第二步我们可能要用到一些复杂的数据模型,去做权重的筛选,如果知道有30个因子都是贡献正期望的,用算法去算每个因子的权重,包括可能会用到神经网络和遗传算法这些东西,这些东西其实一般的交易者和学金融的人是不懂或者接触不到的,这是统计学的概念。所以一般做金融的人和做交易的人都不知道这些东西,只知道估值、PE、PB,但是怎么去用这些因子其实很复杂的。
股票为什么比期货难做,就是难做在首先从数据上开始然后到模型的建立上最后到执行上的每一个环节的细节都很重要。光大的事情,也是因为执行跟信号之间的问题,包括风险控制,这些涉及的层面会比较复杂,比期货复杂,可能100个做期货量化的人只有1个能做出这种股票模型,门槛确实比较高。这就是为什么股票量化的竞争比较少,但是做出来后,它的规模可能是10-20个亿以上。目前市场上真正纯量化的股票型的私募走出来的还没有说特别大,但是未来我相信量化私募界肯定会出现像重阳、星石和朱雀这种百亿规模的私募。一个做得好的股票量化投资公司,甚至可能会超越这些传统的主观交易的私募。
光大事件归因风控机制 量化投资的三大风险防范
私募排排网:您刚才也提到了光大“乌龙指”事件,您个人是怎么看的?
陈曦:如果从公开信息上来说,它可能是风控系统出了问题,主要原因还是在风控机制的问题。这种问题我在期货上也见过,我有一个朋友写了一个底层的程序化交易平台,他除了一个BUG,有一次在没有收到成交回报的时候去不断的发出撤单指令,结果把期货公司的服务器给撤死机了,因为他收不到成交回报,或者他收到了成交回报但没处理好,从原理上来说,如果一直没有收到成交回报,他认为没有撤掉这笔单,所以他就每毫秒去发这个撤单指令。光大有可能类似这种情况,它可能是没有收到成交回报或者委托回报,也有可能是收到了回报没处理好,就以为它的单丢了,那么它就会一直不断的发,最后发现几秒钟的时间就发了几百亿的单。这是第一个问题,就是下单机制出了问题。
第二个是风控体系,它为什么可以发到200多亿,实际上发委托是需要占用资金的,除非你账上真有200多亿,但我不相信光大证券有那么大资金在做套利,那就可能是在证券公司的风控上,没有做开仓前的检验资金的环节,估计他们是绕开了柜台系统,直接向交易所下单的。而证券公司的自营交易时可以在收盘后再结算的,理论上有可能他们盘中可以无限量的开仓,只要收盘前平掉多余的仓位,留下足够资金就行。另外就是整个风控系统对一天能发多少单有个限制,我曾经也出过一单这样的事故,就是软件出了状况,不断的发单,在一秒钟的时间发了几百张单,然后那一天就亏了几十万,所以我们现在在所有的账户上都加了一个交易限制,就是一天交易不能超过多少笔,超过了多少笔就自动停止交易来防范这种风险。
私募排排网:从这个问题上延伸出来的就是量化投资的风险控制问题,你们公司是怎么做风险控制的?
陈曦:在还没有出现光大“乌龙指”事件之前,我在深圳举办的一个论坛上谈了量化投资的风险控制,我举了三个例子:第一个是美国骑士资本一天就损失了4.4亿美金,它是高频做市商,它们全部是用量化系统来做市的,它们的成交量已经在美国进入前三名了,当时它出了状况,很多单都报错了,那一天它们公司的股价跌了80%,然后自己公司损失了4.4个亿。第二个就是98年长期资本的倒闭,长期资本是做套利的。第三个就是87年的股灾。从这三个案例折射出来的风险:骑士公司是软件和IT系统的的风险;87股灾就是市场的风险;长期资本是模型失效的风险。所以从这三个方面去思考我们怎么去规避风险。
像光大这个问题,我们不是肇事者,算是受害者,当天我们也亏了千分之三左右,因为理论上本来是不应该出现这种亏损的,这个事情给我们的反思就是:第一市场如果出现别人做这种事情我应该怎么应对;第二个就是像骑士资本这样,我的软件出了问题我应该怎么应对;第三个问题就是像长期资本这样,我的模型可能出现问题,我该怎样做资金的风险管理;大概是从这几个角度去做。
其实我们很早就想过,对于这些不同的风险点要怎样去应对。首先从模型来说,长期资本主要是做套利的,套利其实做的是回归,套利理论是假设99%情况下都会回归,但是现实中可能1%的时候不回归或者价差继续扩大,价差扩大到很大的时候,杠杆太大就爆掉了,所以对模型来说,我们现在主要做的是趋势跟踪,趋势跟踪是反过来的,就是说你的胜率不是很高,大概有40-45%这样一个成功比例,而且经常会出现亏损。我们是跟它反的理念,我们做的是“肥尾”事件,“肥尾”是抓正态分布的二边,而套利是抓正态分布的中间,所以对我们来说,出这种事件对我们来说其实是机会,一般来说会赚钱。
第二,我们会分散品种和标的,“光大事件”我知道有朋友亏得挺惨,因为它全部都在做股指期货,我们的账户是商品加股指期货,每个品种我们不会配置太多的资金,所以这个品种出现风险的时候,其它品种没有影响,甚至还是赚钱的,这样对我整体的资金损害会比较小。
从品种和资金分配上的分散可以抵抗部分风险,还有一个方法就是从策略上也可以相对去做一些规避,像长期资本做套利的都是这样,基本上是一条曲线一直往上走的,然后突然碰到一个极端风险可能就一下没有了,而我们经常是坑坑洼洼的往上走,但我们不会一棍子就被打死,因为做的模式是不一样的。
第三就是软件的风险。软件风险可能出现的概率是最大的,在编写代码时只要中间错一个标点符号,就可能会在某一时刻爆发出不知道的错误,所以对软件来说,只有把每一个细节去完善到极致。
私募排排网:那你们现在用的软件是自己开发的还是其他平台的?
陈曦:我们目前在用的还是期货的商业交易平台,但是未来我们会用自己的平台,就好像光大一样,也可能会碰到这种事情,因为真正你要做到极致的话,你还得用自己的东西。因为效率最高、速度最快,现在还没到极致的时候。
量化投资进入混战期 量化投资是价值投资的有效补充
私募排排网:很多人都说现在是量化投资黄金时代的来临?
陈曦:量化投资从股指期货开始算是一个初始期,未来还有10-20年的高速发展,现在还是混战期,十年后会进入三国时代。
私募排排网:前期肯定要先把市场弄热闹起来,大家才会接纳,但是到一定程度之后可能就有竞争了。
陈曦:我认为这三年大家都不是在竞争,都是在修炼。就是市场还是够大,我们还是在跟市场竞争,三年以后,可能国外很多机构要进来,就成了机构跟机构的竞争,到时候活跃程度跟现在完全不同。这三年以我们的能力肯定是能赚到钱的,但里面很多都是为了三年以后做准备,包括人才、资金储备、渠道、技术。
私募排排网:怎么看量化投资和传统私募的竞争?
陈曦:在美国其实有几个流派,价值投资现在就没被淘汰掉,但如涨停板敢死队这种操作市场的,随着市场和监管的成熟,这种模式会消失。
量化其实是市场有效性的一个补充,不是直接的竞争,各有各的优势,但是总结下来就是散户会不断的消失,最后变成机构跟机构的博弈。现在还没有到机构跟机构博弈的阶段,现在是机构在吃散户的时代,所以我们现在的竞争还不是那么激烈。未来散户会把钱交给机构去理财,就变成了机构跟机构的博弈,那时机构之间的竞争会加剧。
所以我觉得量化其实是对价值投资的一个有效的补充,不同维度的竞争还没有到。
多因子模型 期货重择时股票重选股
私募排排网:量化投资是你们投资哲学的表现工具,那你们整体的投资哲学是怎么样的?
陈曦:哲学就是量化,用模型去交易。但是我们会多策略,就是我有做趋势的、有震荡的、有追求大趋势的、有追求小趋势的、有一些跨品种的、有一些对冲的,从不同的时间和空间维度去定义。
从思路上来说我们会有很多策略,刚才说了我们有100套策略在跑,我们会分散各种策略,能尝试的都去试,只要是正希望的我都去用。
私募排排网:那你们的模型是自己开发?
陈曦:我们的模型全部是自己开发的,平台现在是用商业平台,年底的时候我们可能会上自己的平台。