首页 > 新闻 > 一财号

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

量化投资的未来:理解和应对不确定性

2022-11-22 17:13:27

作者:张晓泉    责编:高雅馨

图灵从数学的角度提出了全新的方法论,用了逻辑计算一种底层逻辑的方法来计算,最终大获成功。

#01

先给大家讲个故事。

1940年代二战期间,德国开发了恩格玛机的加密密码器。因为密码机加密方式的复杂性和情报的及时性,破解密码的时间理论上只有24小时。

如果第一天没有完全破解的话,第二天密码换了就得重新开始。所以英国当时找了很多破密的人。

图灵就说了一句话:”我不想去做暴力破解,我希望开发出底层逻辑的东西,这样的话有任何的密码、信息,我都可以及时地破解。”

图灵从数学的角度提出了全新的方法论,用了逻辑计算——一种底层逻辑的方法来计算,最终大获成功。

故事触发了我们对量化未来的想象。

量化1.0,多因子线性模型。

量化2.0,机器学习非线性关系。

量化3.0,我们认为是数理统计+机器学习+经济金融模型三样东西的结合。

这张图就解释了为什么要将这三者结合起来,因为他们的目标是不一样的。

经济金融模型的目标是做解释,要把底层的逻辑搞清楚。

机器学习就是暴力破解,我不需要知道底层逻辑,只要做预测就好。

数理统计是更好地描述数据的分布,这三者缺一不可。

如下。纵轴是预测能力,传统的机器学习会希望把预测能力往上推。横轴是经济金融理论,希望能解释现象,把底层的逻辑搞清楚。

预测与解释有时候是矛盾的。

比如地心说预测能力很强,但是解释能力很差。它能预测太阳东升西落,但它的解释能力、底层逻辑是错的。

而进化论解释能力很强,预测能力就很差。进化论能解释清楚人为什么从猴子一直进化到现在,但是人未来长成什么样子,难以预测。

 

#02

我们认为每个人对世界的看法都可以拆解成很多小的逻辑,世界一共就4种状态:均衡态、循环态、随机态、复杂态。

其中均衡态就是小球放在碗里,推一推它还会回到碗底。

循环态就是不管东西怎么绕,到后来一定会回来,比如经济有周期。

随机态也是一种状态,没法预测,但它会产生随机的数据。

复杂态就如同蝴蝶效应,一个很小的扰动都会导致最后的结局非常不一样。

这4个状态在金融市场里都是存在的,我们的目标是寻找办法把它拆解出来,从底层去理解这些状态。

比如人的身高,如果用正态分布去描述的话,会描述得比较准确,如果用幂率分布,结论就很容易错。

所以模型是死的,最重要的是我们这些人应该用什么样的逻辑方法去描述这些数据。

股票数据也是如此,尖峰厚尾,但我们现在用的模型大多数是基于正态分布,能不能跳出正态分布去找新的底层,从科学层面去理解金融数据呢?

 

#03

概率分布实际上经常不存在,很多人对不确定性的理解还不够深刻,认为不确定性就是波动率,波动率一高,不确定性就上来了,但并非如此。

Laplace在1814年就说,概率分布在很多场景下都不存在。这句话是对的,比如战争、选举、研发、婚姻、投资…

Laplace认为,当不知道某一事项概率分布的时候,会认为所有的概率都相等。

这就明显不对了。

所以不确定性有几个级别?

(1)确定性就是我从这里面随机抓小球一定是黄色的,如同太阳东升西落是确定的。

(2)风险是明天有70%的概率股市会涨,30%可能跌,这个70-30的比例就是我的风险。

(3)黑天鹅理论是说,可能有非常小的概率,产生我之前想不到的结果。

(4)第四个是风险之外的不确定性,但是目前没有统计学和数学的工具对其度量。如同我知道明天股市要么涨、要么跌,但我不知道概率分布。

以上四种风险哪种更贴近真实股市的描述?

主流金融模型现在用的模型都是第二个,但实际上是第四个。

我们不知道分布,我们需要有数学工具去解决它。我自己的研究一直在这个方向上。

 

#04

结果不确定性与分布不确定性。这两种不确定性是必须要区分开的,所以如果你用了传统的模型去分析非常复杂的金融市场,那可能就会有很大的偏差。

风险和不确定性是两个概念。

举个例子。

ABC三个病人,感染病的概率分别为95%、30%和50%。

那谁的风险最高呢?

病人A。

谁的不确定性最大?

病人C,因为我们对他没有信息。

传统机器学习的局限性在于:你用了神经网络,把损失函数最小化,求了最优解,找到了最低点。

但金融市场的损失函数可能是以下的第三种,从起点出发优化半天,找不到最低点。

所以问题在哪里?

问题就在于损失函数形状非常复杂,里面的不确定性导致用传统的模型也没法找到最优解。

我们放松了独立同分布的假设,基于独立不同分布的假设做了很多推导。

得到的结论是,传统模型认为95%的概率会发生的事,加一点点刚才说的风险之外的不确定性,置信度就从95%降到了60%了。交易时如果按照95%的信心去交易就会承担很大的风险。

所以当我们对不确定性理解更深刻的时候,交易的行为也会相应发生改变。

黑天鹅的厚尾也是一样。

厚尾传统是拿Kurtosis第四阶做分析,尾部厚度3就是正态分布。

当市场上不存在分布不确定性的时候,拿到并不是正态分布这样的尾部,一旦存在一点点不确定性,就发现Kurtosis迅速增长,所以它的尾部厚度立刻就增加了许多,之前用的模型就不可以用了。

 

#05

我说了半天数学,并不是为了迷惑大家数学很复杂。

给大家举个例子,数学到底能做什么?

就两个结论:1、有美股的可以减仓避一避,2、想冒险的可以做空一下。

大家都知道2月底美股就发生股灾了。巴菲特也说过:“过去238年有谁靠做空美国赚过钱?”我们团队就笑了,我们确实是在2020年做空美股赚到钱了。

下图黑线是我们的指数,当它从高点迅速地降下来,超过临界值横虚线的时候,就会有信号发生,从信号发生一直到真正的股灾,就是红线部分。

过去30年里,1987年、2008年、2011、2020年的股灾,都给出了非常准确的信号。

如1987年,它在临界线上面迅速穿越之后1个月之内就发生了股灾。

2020年,同样的,1月2号超过临界点,于是我们做空购买TVIX指数,从39块钱,在一个月之内到了1000块,实现单个策略回报率25倍左右。同时以0.25美元价格买了看空期权,最终涨到25美元,实现单个策略100倍。

 

#06

我们不仅要看结论,也要看结论的逻辑。

股市,如果机构在过去一个月之内胜率很高,也不一定真的表明个人能力强,底层逻辑对。

所以我们内部会讨论很多类似问题:你的逻辑到底对不对?

停着的钟一天也总有两次时间是对的,所以即便策略是错的从纯概率角度也有可能战胜市场,但如果想要长期战胜市场,底层逻辑必须是对的,而不能是结论暂时正确,这是第一个观点。

第二个观点,我认为金融市场像海洋的生态,不同的投资者是不同的鱼。

但从生态学上看,鲨鱼是不可能吃光所有小鱼的,没有一种策略能完全收割,但强的鲨鱼可以让弱的鲨鱼没有食物可吃,走向灭亡。所以相同策略的情况下,有可能导致非常卷的竞争局面。

量化的未来到底是什么样的?

我们认为现在是量化非常初级的阶段,所有机构都不是鱼,是草履虫。为什么大家觉得策略很卷,很相像,是因为现在处于进化早期,大家都用一样的策略,都吃一样的鱼,于是觉得竞争激烈,行业内卷。

到了未来必须是每一家量化机构都有自己赖以生存的方法论,那各个机构就会变成不同的鱼,形成完整的金融生态。

 

 

(作者张晓泉为清华大学经管学院Irwin and Joan Jacobs讲席教授)

 

文章作者

一财最热
点击关闭