(本文作者张晓泉,清华大学经管学院 Irwin and Joan Jacobs讲席教授)
股市的风险一般是用波动率来衡量的,但是波动率并不能完全捕捉到所有的风险。
有没有别的方法呢?
今天讲讲怎么用物理学和信息论里的概念——熵(entropy)——来衡量股市里的风险。
这个思路是基于一篇论文:
Almog, A., Shmueli, E. Structural Entropy: Monitoring Correlation-Based Networks Over Time With Application To Financial Markets.Scientific Report,9,10832 (2019).
关于熵的定义和公式有很多,但总的来说,熵就是用来衡量实验可能结果的信息量或不确定性的。由于意外和不确定性是金融市场的日常,所以,把熵作为一种研究市场的工具似乎是一个不错的想法。
其中,香农熵是统计学和机器学习中最频繁使用的一种熵。下面就来看看它如何在金融市场里发挥作用。
论文中引入了结构熵的概念,并将其应用到了金融市场,以监测基于相关性的网络随时间的变化。
数据分析
分析采用的是Kaggle的每日收盘价数据集。该数据集包含了32只股票,分别来自不同市场板块从2000年到2018年连续交易的数据。
对于数据集中的每一只股票,推导出其每日对数收益的时间序列,对价格(对数收益)进行对数差分可以得到适合测量范围的稳定的正态分布信号。
然后用常规的测量方法去检测数据中是否存在波动。
波动性(volatility)是对给定市场指数的收益分散性的统计度量,这个度量是指与市场变化规模相关的不确定性或风险水平。高波动性对应股价的高波动范围,说明资产在短期内可能朝任何方向发生剧烈变化。低波动性表明资产价值的波动不会太大,趋于稳定。
在上面的数据中,高波动期出现在2000初期(网络泡沫)、2008年(金融危机)之后以及随后的一些时期。
结构熵
将金融市场表示为基于相关性的网络也是一个很有意思的想法。
将网络节点表示为金融资产,网络边表示它们之间的相互作用,这种相互作用通常用价格相关性随时间变化的幅度来衡量。将金融市场表示为基于相关性的网络,对于识别动荡或结构性断裂很有价值。
基于网络这种结构,结构熵是一种量化给定网络中结构多样性水平的度量。
在这个框架下,结构熵指的是网络中节点的异质性水平,其前提是具有共享功能或属性的节点比其他节点的连接更为紧密。
接下来,通过以下步骤计算给定时间范围内的结构熵:
将这些步骤整合在滑动窗口程序中,就可以监测目标系统中随时间变化的动态。其结果是一个新的结构熵值的单一时间序列。
简而言之,结构熵相当于调整过的香农指数,二者都是多样性指数,但结构熵可以从具有空间和时间依赖性的复杂结构中提取出有价值的信息。
执行完上述步骤,得到如下结果。
当网络中的所有节点都被分配到同一个社区时,结构熵的最小可达值为0。当每个节点组成一个单独的社区时,则达到最大值。最大值取决于网络中节点的数量(观察到的序列数)。
正如案例中所展示的,结构熵可以捕捉到2000年早期(网络泡沫)、2008年后(金融危机)以及随后一些时期的波动。如果把相关矩阵看成一个用散点图绘制的图表,就可以直观地解释背后的原理。
其中,点代表单只股票(网络节点),颜色是股票所属的聚类(由社区发现算法创建),边是关系的强弱,两只股票的相关性超过一定程度,则会将边绘制出来。
在结构熵最大的时期,股票往往各自独立,形成独特的聚类。在中等结构熵时期,可以看到,一些股票属于同一个聚类,并存在较强的相关性。在低结构熵时期,大部分股票属于同一个聚类,并存在大量的相关关系。
小结
上面介绍了一种新的方法来观察价格序列几何结构的变化——即通过结构熵来体现资产价格随现有信息的功能变化而变化。
在这个过程中,信息的简单变化会立即反应在价格上。从这个角度看,结构熵可以从时间和空间的维度上对金融市场的关联性进行度量,并对涉及不确定性的情况进行描绘和计算,以此来帮助衡量和判断股市里的风险。
本文仅代表作者观点。