您当前的位置:首页 > 行业专家 > 专家文库

李大鹏:量化交易的技术环境分析

2016-01-11 来源:

2011年5月14日,在第六届中国(北京)期货暨衍生品市场论坛(CFDF 2011)上,上海寰融信息技术咨询有限公司首席执行官、香港交易所的总裁高级顾问李大鹏做了主题为演讲的题目是“量化交易的技术环境分析”的演讲。

以下为致辞演讲实录:

  李大鹏:因为我的时间很短,就直接讲了。今天我主要讲的内容有这五部分,量化投资综述,量化交易环节分析,技术环境综述,技术环境分类,以及案例分析,实际上都是围绕量化投资来介绍。首先量化投资在国内不光是期货界在谈量化投资,而且证券行业他们也在谈量化投资。一般来讲,我认为讲量化投资其实很多人用不同的观点,其实在一个最简单的基础上就在数据的基础上使用计算机实现投资目标的行为,就是一个量化投资。

  当然你具体用什么样的方式是百花齐放,所以他底下有一个,我给出几个外延定义,比如说有人叫做投组交易,或者叫做程序化交易,这些都是直接从英文翻译过来的。还有一些叫系统交易,这个东西含义是什么呢?实际也是最早,但是你感觉本质上就是通过计算机代替我们的人为策略制定去进行执行。底下真正讲的量化交易是从英文词直接来的,讲的就是我说的这个定义,核心就是说以数据为基础,用计算机去执行,至于策略你怎么定,都是仁者见仁智者见智。

  底下争议比较大的高频交易,你现在听很多人讲HFT,后面可能会涉及到,也是实际量化投资的一种。底下还有一种叫统计套利,这个用的也是很多的,也是量化交易的一种。实际上在机构上用的是比较多一点而已,我在这讲,今天因为我是从技术角度去讲,我不想去讨论很多真正量化交易模型的问题。因为说句实在话,量化投资不管是程序化交易,高频交易,核心盈利本质是你模型好坏,但是很多人都忽略了一点,你模型有时候写的非常好,但是肤浅,就忽略了技术环节分析,你再好模型真真正正在计算机里面算,但是你拿到的信息他的质量不好,你算出来的东西可能并不是反映真实的市场情况。

  第二点即使你得到非常高质量的信息,而且你及时算出来了,用你的算法做出决策了。我们大家都知道,你把报单送出去以后,并不是按你理想情况执行了,所以说就是我们俗话说的手工操作,大家各位如果在市场都知道,你抢单抢不着,也赚不着钱。但是从量化交易来讲,这个问题同样存在,这就是我们要讲技术环境分析,为什么会造成这种情况,这是我今天要说的。

  所以,关键因素里头,投资模型不是我们今天要考虑的东西。真真正正能拿出来公开讨论的模型都是不赚钱的模型,凡是赚钱的模型谁也不会拿出来跟别人分享,我告诉你这是一个铁律。所以,我说教授网站上,当然作为教育去教育后来者,或者让大家朝这个想法去做公开讨论算法是对的,我完全支持,我希望哪天也到教授网站上去看看。但是我知道美国非常有名高频教育网站,你甚至没有盈利的记录,他都不让你进去,你不能成为他的会员,这个你们可以去找找。

  所以,我们不讨论模型。但是交易成本,风险控制这是大家都要讨论的。我说的市场数据,实时行情,还有历史行情,再加上其他非常重要的最后一个,信号,因为什么呢?交易信号,这个交易信号是买方跟卖方,作为卖方交易信号是什么,作为买方交易信号又是什么,你在设计你自己的算法时候,这点不清楚设计东西不适用,我不会说你设计反了,但是不适用。

  还有我刚才讲的执行程序延时度一定设计好,中国的期货市场,股票市场,执行程序的环境到底是什么,也是我们今天要讨论的事情。这个实际最主要一点就是延时度的问题,还有参数控制。最后一点就是系统环境,系统环境里头我说了一个是单市场质量,比如说金融期货交易所他的单市场质量是什么,如果在后边讲多市场有效性是什么,我既然要做这种无风险跨市套利做沪深300,我在金融期货交易所他的环境是什么我们了解清楚了,但是你做无风险跨市套利一定要到股票市场做反向套利,他的市场是什么,能不能实现这种无风险的套利策略,你设计模型理想很好。

  各位今天都知道,在现货市场是不满足我们这个期货真正无风险套利的。那你的算法应该怎么去修正,这从技术角度驱动我去想这个问题。当然我在这列了一些,我列了最基本标准教科书的算法,参考书我搁在最后,算法的分类以关键因素去分的时候,以时间表怎么触发,以时间基准,有交易量基准,还有一个是比例,所以是量比,前头这几个是非常流行的,你要研究量化交易一定要懂这几个基础模型。

  底下这个是动态标杆,以价格作为动态标杆,还有做比例的东西。底下动态标杆,我不知道中文叫做什么,Price Inline,还有Market On Close,这就是基本几大类。这不是具体做法,我就不忽悠各位没写出来。核心交易模式我们讲技术模式,在技术上有几个比较大交易模式,它的对比,好坏对比,我大概列了一个表在这,这也是参考书上有的,但是各位可以看一看,是什么呢?他主要有四大类,两大类里头的四种,一种就是中间手工的,不知道你们喉头能不能看的清楚,喉头三个都是属于直接连到市场,市场用电子化交易的。电子化交易里头有三种,一个就是DMA,另外一个就是非常有名的暗池交易,你不是机构也没有办法做,他一般都是机构做的。

  最后这个就是很有名,根据你的反映速度,持仓短,有高频交易,低频交易,喉头会进行减少。各位可以看到,我们不讲仔细什么,他几种交易方式从技术角度来讲,有效性上头,可以看最强的就是比较好的我用红的标出来,算法交易前两项从容量和速度来讲是最好的,所谓容量讲的是什么呢?你可以使用的资金量,你用来去做的东西,因为有的东西你资金打的时候实现不了,所以资金量是一个限制,你一定考虑这个事情。

  还有一个控制度跟透明度,所谓透明度就是说,因为欧美市场很讲逆命性。这一点透明度对市场信息披露DMA是最强的,是这么比的。所以,各位来看,从总列来看,各项指标评下来,算法交易平均值最高,因为有四项是最好的,有两项是弱的,其他都是中的。所以,你可以看出平均数最好,从技术环境角度来讲。我们下一步去仔细看一看,他有一些什么东西。

  首先我们讲量化交易环节分析,参与者的类型。其实两大类,就是买方跟卖方,我说的买方卖方各位在期货市场比较知道无论是买一个股票,卖一个股票,我在期货市场我是看多,中文老讲不明白,你是买方还是卖方很难讲。我讲的这个买方卖方是你在市场里的地位,所以卖方是谁就是机构。咱们以这个债券为主,如果我是债券发行商我肯定是卖方,我只要把它发行出去才不管他平不平仓,我发行完了就行了。

  买方就不一样了,你买了这个债券,你就要想这个债券达不达到我的盈利目标,达到之后我要不要卖出去。所以,各位如果你是投机的话,我说的投机期货市场投机产生流动性,是一个非常好的参与群体,你是投机的投资者的话,你肯定是买方。因为你要建仓以后要平仓获利,卖方他只是把这个交易完成,至于他后面没有什么后续的平仓获利问题,你说他卖出去建仓了吗,建设不建仓。当然在期货市场不一样,你只要是开仓就有仓位,就要想到平仓获利的问题,所以期货市场基本上是双方买方市场,如果是套期保值买方至少持仓在一个星期以上,这是我们定义。

  所以,你一定要清楚市场参与者是谁。我做投资策略的时候,这个策略是完全不同的,从技术角度来讲你的要求也不一样。有的时候我买了这个系统,他说他能赢钱,为什么我用的不一样,其实一个本质你把这个决策给用错了。底下讲这个历程,实际上量化交易流程无非就是这些,行情坚守,决策制定,交易执行,结果处理,风险监测,还有后面很多人忽略了获利退出,是专门一个环节,不是你一个模型里头的东西。所以,你做模型流程的时候,如果缺了这个模型,我开了仓什么时候平仓获利,你这个环节不考虑好,开始设计模型就不设计好的话你就麻烦大了。

  所以,最后一点也是属于每天晚上要反思,我获利了也要反思,我亏损了也要反思的参数反馈,你不做该亏钱还得亏钱,你说赢钱可能今天赢了明天人家做更好模型就亏了。这些环节大家都要注意,后两个环节往往就忽略了。当然量化交易的目标,刚才我说了买方的目标跟卖方目标是不同的,举个例子,因为我没有详细列在这。卖方他唯一的目标是什么?我们在股票市场来讲,量化交易可能在期货里也相同,你有大量的持仓,你要在市场上抛出的话,或者买入的话,你的目标是什么,最高的目标就是用最低的成本完成这个交易,这个交易完成我就不管了,因为我没有平仓的问题。但是这个时候你要做的是什么,所谓的要是用最小的成本是什么,就是真真正正在市场这么透明的一个市场如何去隐藏你的买卖方向,让市场不知道,这是你制定策略的时候最重要的一点。

  所谓量化交易最早就是从这来的,我有100万股,比如IBM股票,我为了不引起市场价格波动,我会拆成一万份,在不同所有能交易的市场去投,让别人不知道我的交易意图。这是真正量化交易最早的名词就是这么来的,当然后来很多人卖方,其实卖方算法发展非常完善,所有的投行都有自己完善的卖方算法,这是很早就有了。而只不过像我们讲,买方后来也跟随,我发现市场价格动的时候,第一我要从价格动向里探索出来卖方意图,我不管意图只要发现就做短期交易,所以目标完全不同,控制参数当然也就不一样,我就不细讲了。

  技术环节,真真正正细节,各位每天你要在设计算法已经接触到了,首先一点所谓算法交易,量化交易他的一个源头就是交易所的行情,你这个数据拿到的行情质量如何,你怎么去评判,还有一件事,像我们大家可能都是做期货交易都知道,我们国内4家期货交易所大概发出来行情是统一的,都是500毫秒一次打包。你接到以后,一解包看起来是逐笔,实际上是500毫秒之后的事,你看的是历史,你根据这段历史去测制定我的投资策略的时候,你已经晚了500毫秒。所以,你读到的这些报单,成交都不是当前在这个交易所撮合最前端的东西。

  所以,交易所行情你要了如指掌怎么去处理,这是我说的延时处理。实际上有一个算法,我看了所有谈算法交易的书上都忽略一个,我就在这提醒各位,这个其实从数学上来讲很简单,你怎么去做差值算法。他这个差值有两种,一种是历史的,我没有拿到的数据,我去做差值补充。还有我做预测的时候,我拿的是500毫秒之前,我要执行的订单很可能是500毫秒之后,加在一块差一秒钟,这是一个灾难性,决定性的延迟。所以,预测的差值跟历史回顾的差值,你用积分其他复杂算法也可以,我们会谈到你做这个算法交易模型的时候,这个模型越简单越有效越好,因为计算机不允许你多做,几毫秒都是灾难性延时,所以差值是最简单方式,但是你要做的有效,怎么去做很多人没有注意这一点。

  还有历史数据库的引用,因为所有的算法交易其实各位你要做设计都知道,我是根据历史数据去判断将来的走向,统计分析的。但是这个时候做的时候,引用的数据越少越好,原理其实很简单。我引用数据越小,我想的时候越少。但是你少的时候是非常快速地反映了,但是这个反映你数据引用的时候少的时候,你想的不精确,这时候怎么做平衡,这就是做测试的时候,真正做算法研究的时候怎么做,这也就是挣钱的人,我相信做的好模型都在这种小的地方,比别人高出一筹,你要时刻问自己我这个模型是不是能再简单,结果能不能做精确,我说每天晚上最后一个环节交易回复就是这个问题,不断问自己怎么简单模型再简单,准确再准确。

  当然了,决策制定的时候目标一定要明确,我说的决策制定是交易决策,执行问题,在下单之前,其实这跟人工完全一样。你下单的时候!你这个目标一定要明确,我在什么价位成交,这个价位能不能成交,这个策略很多人忽略一个参数,叫最大可执行度。什么意思?其实说白了各位天天在干的,那会我还在交易所的时候知道,每天下午一点半一开始你接单子,你送一万张今天抢到一张就可以下班了,你不抢到单子就没有盈利地机会。所谓最大可执行度,你在送报单出去的时候,不要想最佳点,你要想想人家抢到最佳点,我抢第二个最佳点,或者第三个的时候可能性多大,我损失一点点利润,但是我只要能执行我这个单子就能获得利润,这是最重要的一点,做这个模型设计的时候。

  当然了底下的策略执行,所谓策略执行在我们国家市场没有那么复杂,我们就是单市场,一个市场交易一种品种,没有跨市场的问题。但是你在美国市场,我给你讲,比如股票期权,一个股票期权可以在6个交易所进行,每个报价和交易成本不同,我怎么去分,把这个单子分成多少份去做。当然在中国市场这个很简单,你们可以不考虑,但是一旦某天你到境外投资的时候要想这个问题。

  还有结果分析,所谓结果分析是什么呢?我把这个单子成交之后,拿过来了,我要看我的盈利目标要不要调,因为你的成交价位可能不是真正你送出去的价位,我真正盈利的时候是不是能达到,别到最后还按原始价位平仓了,你最后算下来交掉手续费之后反而亏钱了。所以,所谓成果分析是成交成果分析,你在开仓的时候,这就是买方一个特殊要考虑的,卖方他用不着考虑这个问题,我只要成交我今天就万事大吉了完成任务了,因为这是国家给我几百亿,像央行债券发行一样,今天180亿我只要把180亿谁给我认购完就行了,你说央行什么时候平仓买回来获利他才不想。

  在技术环境分析里头,就是我刚才说的投资者环境里面就是我们要说的,数据接受,你接受。当然交易所的行情各位都直接从交易所行情发布服务器上收来,但是我知道大家可能一定要测你的接受服务器延迟跟交易所送出来延迟。我问问各位,你心里有底没有,你延迟是多少?你们都答不出来,上汽所期货大厦跟张江之间,这两个主机之间如果要切换的话,这两个之间的延迟说是忽略不计,但是你要到微米级是有差别,因为大厦跟张江之间有25公里区别,尽管是光纤。你说你接受服务器搁在大厦里,但是你今天发布机在张江,发出来东西是一样的吗,你这个算法能保证你今天设计盈利吗,这些东西精细点心里要有数,我不是说到时候哪一天切换你会亏损,其实你不会亏损,但是你心里有数之后,算法参数怎么调这是一个精细的东西。

  还有成本因素,不光是说交易所的收费了,还有一个我在这一个单子执行的时候,我这个单子下去,很多算法是这样。比如趋势型交易,各位都知道趋势化交易不是那种价差套利是追这个趋势走的,你追这个趋势走的时候,你这个成本分析要没有,你追到什么时候为止,非要到成交,成交以后回来一算,今天价格不到,最后你平仓的时候把手续费一交反而还亏本了,这种东西怎么算,这个模型有没有在算法里头,这个都是要做的。

  当然底下通道环境会员,可能是期货公司给你提供的这些东西好不好,有的期货公司说我的服务器是旧的交易所托管里头的,其实我给你这个没有太大区别,关键在你的算法。如果我是期货公司,我的机器就在交易所机房里,他们就隔了一层楼,2、3楼的问题,但是问题在这了。他的机房发出来的东西是一样的,可是你真正接受的时候,你的模型算法服务器在什么地方,你这个通道能不能解决时差问题,你心里有数吗,如果没有数的话,你光把服务器搁到最近的地方是一点用没有。

  所以,这个东西我说的就是整个一个全链条。为什么刚才说流程呢?刚才说的那个流程里我没有画图,因为时间不够。他每一个图形中间都有技术的服务器跟你的运行地点因素在那,你把它都画出来,看看他每一个延迟是多少,就知道你这个算法要调整多少了,这个非常重要。当然了交易所的监管措施,跟行情发布,还有撮合效率,我所说的监管措施是什么?现在交易所,比如说每天开仓总数限制大概是多少,我离开交易所一年也不去看。这种类似的,你在监管措施允许的程度下,你能不能去实现你的模型,如果你的模型一天一定要交一个500笔才能盈利的话,那就不就歇菜了,第二天行情不一样你还做什么,监管措施很重要,不是开玩笑的事情。

  还有一个行情发布,撮合效率。撮合效率第一你要心里有数,跟各位讲一个实话,上汽所,大商所和证商所他们撮合速度不一样,跟你成交率也是非常有关的。所以,这个东西你要没有测过,实战地测过你设计模型也等于留了一个洞,你都不知道为什么不成交,你的模型为什么不好。通讯网络各位都知道,但是我为什么不想多说,这不是咱们管的事,是电信的事,但是你一定要想到别让他给你掐了,就跟陆家嘴(600663,股吧)一样一施工把光缆给挖了,这你找谁去。

  我们刚才实际上已经基本谈过了,各种量化投资技术环境综述。我现在把这个列出来,大家看一下。国内期货市场这个行情延迟,我刚才已经说了500毫秒,这个东西是一个硬指标,你在这个环境下,我怎么去设计模型,但是有一点如果你拿那个模型,比如像教授说的,我把这个模型做的很成功你搬到台湾去了,我相信90%你会亏钱。台湾行情延迟跟大陆是不一样的,是不是500毫秒我不知道,没测过,香港也不一样。美国大概行情延迟应该是在50毫秒,这就是为什么美国模型拿到大陆来,往往全输钱,就是这个地方,这是一个很关键一点。你看的是50毫秒行情反映,结果你拿到国内之后我这个同样在美国赚的一塌糊涂,到这里必定赚,这不是胡扯的事,我这个历史数据拉长了10年。美国200年历史,你拿到中国来也学,中国5千年的历史,人家拉长25倍,你怎么去不一样的事情,这是同样级别。

  还有一个国内期货市场持仓限定,其实国外也有。持仓我没有看到仔细,扯单在国内是500次/天,当然500次以后,反正各个期货老总就开始接到电脑你怎么扯单超过了找客户停止。芝加哥我知道,你大概一个小时或者多长时间你要扯单50次当天罚款,不仅不让你做,所以国内还是比较人性化的,你以为中国期货市场监管严,还是非常不错的,中国哪个交易所罚你款了。

  停板限定,所以说这个也是一个成本,我说成本因素刚才已经提了不重复。现在国内证券市场,其实他也在考虑这个事,为什么?ETF,基金也在考虑量化,确实在国内卖方市场最早,其实国内也在做,当时我们国家上证所深交所有一个特点,叫做大宗交易平台,但是一般人不能参与。另外一点,如果很多人就是要在二级市场去卖的话,你怎么去做,这个行情怎么做。我知道上证所也在研究这个事情,另外国内证券市场为什么他是纯量化交易在国内只是卖方市场,没有买方市场就是后边这个原因,证券就是T+1,你得等明天行情变了。

  当然我们做期货做惯了隔了24小时一个天上一个地下,股票还比较好还可以睡觉,至少不会差那么远。可是他这个T+1,实际上不能做,至少我们高频交易现在不可能做的。我知道欧美市场也不可能做这种高频,高频交易都是在衍生品市场,欧美都一样,股票不行,还有一个停板限定也一样。我为什么说国内OTC市场,国外有一些OTC市场也在研究量化交易,我是想不明白,这个从哪去做,所以我搁了一个问号在这,各位可能比我更有体会。

  我们国家最明显一个OTC市场就是银行间拆借市场和外汇交易市场,我就琢磨不出来哪些人怎么去做量化交易,他报价都是公开的,而且OTC本身就是大单一笔几十个亿,反正咱们两个人一谈完成交够行了,也没有必要隐藏什么东西,也是一个封闭,就2千个会员其他人不能介入。通信网络已经讲过了,现在期货技术可行性分析,本来想找几个例子咱们聊一聊,但是我现在时间已经超了,就跟各位讲一个。

  黄金跨市套利量化交易,各位都知道,上海期货交易所有黄金操作,我不知道各位谁试过,我能在这讲就不做这种交易。我从来不讲一句话了,没准我去做交易了,可能你们有这种体会。黄金跟他这种T+D,和上海黄金期货交易的套利怎么个套法,各位可以研究研究,很有讲究,有一个固定价差,好象是100块人民币,你要弄好跨市套利是稳赚钱的地方,你模型弄不好可能两边亏钱,亏了别找我,赚了念着我行。

  所谓高频交易,现在大家争议最大,不光是我们在讨论这个东西是不是在哄抬物价还是什么,美国证监会从去年5月6号股市大跌又开始重新做了,其实美国对高频交易批判不仅这一次,87年那一次就在使劲批判,中间那几次只要股市有大跌批判高频交易就一定有。反正,他们苗头一致对准高频交易。所谓当日无持仓,他的一个特点你们也想得到,他基本不看基本面,股票你能做,股指你要能做用不着看基本面,就看几苗种几个价格位变化,我只要算法做对了就可以盈利,而且盈利了我马上就走。所以,你用不着看基本面,就是一个纯行情的博弈作为技术分析。

  我所说中频就是隔日持仓到一周之内持仓,一定跟短期行业信号有关的。所以,你不看行业,你只看高频一样纯看技术基本面,我看价差等等,但是你只是隔日持仓,你没有行业基本知识你这一个礼拜持仓绝对是赌博,不是一个理性的投资。所以,这个要做。一周以上,我说卖方还行,我们讲套期保值经常一个月,而且要持仓,他是对宏观经济对自己的实体经济走势需求,你如果也是跟踪这种,在你模型里也要去做这一把。其实这个东西大家都知道,如果这个是低频交易,你只要走对了是真真真正赚大钱,这个没有宏观经济考虑你也不可能。

  为什么?看到我这个GFT就是我现在公司,我们为什么做这个事情,我把整个现金流动向跟国家宏观经济提供给投资者,让你也看到我这个市场行情走动,他背后暗流涌动跟宏观经济到底有什么感到。但是这里头有一个非常重要因素是什么,提出一个新的,不光是现在行情数据分析,而是一个新的领域,叫“新闻分析”。

  现在华尔街有一种叫话机器人读数据,我们现在也做类似事情。我不光是行情数据数字分析,这个东西已经做很成熟了,一个事件一出来,比如说本拉登一被击毙,这个事件一出来,我怎么能马上知道他的金融含义是什么,明天各个市场一开市反映应该是什么,这就是新闻分析的一个核心点。实际就是一个金融事件的信号产生,这是我们真正要做的。

  当然了我们产品还没有出来,出来以后希望能给大家带来收益。再一个就是跨市场套利,我就不想多说了。现在经验就是在这,成本中套利保险,各位如果你做套利的话,你一定要清楚,我的这个反向,你只要有一个作为是正向,另外有一个是反向你一定要坚持去做,所以算法建议强调一点严格地纪律,这句话一说,我到军队里,连队里军训一个月就成了,不是那回事。第一个非常重要,不管我的单向,为什么在算法交易里我个人不看好趋势化模型在哪,他趋势模型里不强调这个反向对冲设置,你要是无风险套利的时候反向对冲是一个纪律,我必须要做,这是我买保险。就跟各位开车一样,当然现在交给抢险一定要有的,没有就别上路。

  还有一个执行纪律的体现在哪,坚持这个参数设置。所谓坚持这个参数设置,你每天要去反思今天的模型怎么回事,这个参数是否反映情况,如果不反映为什么,要不要调,这个东西每天不去做作业,做城市化交易的人不是去逛公园,真正开市最放松的时候,是机器给你做,一闭市就是你干活了。这个东西你要不做,你程序化交易今天赚钱明天就亏。

  还有买方执行力度,没准哪天你替客户发行一个东西,发行债券,发行股票,你这个执行力度在这是非常重要的一个问题。我怎么能替客户把这个执行好,但是这个怎么做,今天跟我们期货市场没有太大关系就不多说了。还有一个薄利多销,在算法里面也有一个纪律就是不能贪,你今天幸运可能挺好,你明天就亏了,到了点就走人,薄利多销盈利。

  底下这几点不多说了,我已经超了。当然可能南华期货因此上证所都是内部资料,不知道你们能不能拿到,但是第一本英文书书店里面都可以买得到,非常好的一本书,向大家推荐,谢谢大家。

友情链接