睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

关于混频数据模型助力风险测度的浅析

时间:2022-09-24来源:别惹我我是男神浏览数:810

前言

随着经济全球化飞速发展,各个经济体之间的联系日益紧密,如何通过风险管理有效预警金融危机成为全球共同议题。微观审慎监管和宏观审慎监管是现代金融风险管理中两种重要的监管方式,这两种模式下,风险测度都尤为关键。风险测度的有效性依赖于多样化的信息,在大数据时代,尽管可以获取到大量数据信息,这些不同来源的数据频率却往往不相同,即存在混频数据问题,比如宏观经济指标多为年度或季度的低频率数据,而金融指标多为日度的高频率数据。因此,如何使用历史混频数据准确测度金融市场风险就成为了一大难点。本文基于混频数据处理方法,结合目前巴塞尔委员会鼓励银行使用的风险管理指标,浅析Expectile混频数据回归分析方法在风险测度领域的应用。

01风险测度概述

风险测度,是指通过一定方法和技术,对金融风险进行定量化分析与研究,以评估风险的合理性,根据巴塞尔协议,风险测度指标有在险价值(Value at Risk,VaR)及预期损失(Expected Shortfall, ES)。VaR表示在一定置信水平下和给定持有期间内某金融资产或组合可能发生的最大损失,能够测算统一口径下各类资产及组合的风险。VaR只计算某分位点损失的特性,不考虑超过分位点的风险,易对风险低估;且VaR根据历史数据进行推算评估,难以在预测小概率的突发风险事件时有好的表现。由于VaR存在缺点,预期损失(Expected Shortfall, ES)的概念应运而生,即在给定置信水平下,资产损失超过VaR部分的条件期望。相较于VaR,ES更关注于极端的尾部风险,且满足一致性原则,但由于不可导出的特性,ES的测算和返回测试更富有挑战性。目前VaR和ES指标的计算需要大量历史数据作为支撑,为确保模型的有效性,数据的处理尤为关键。如何高质高效地处理历史混频数据,并用于精确计算风险测度,已成为重要议题。

02混频数据处理方法

1.传统的混频数据处理方法

1)将高频数据低频化——集成法

“集成”是将高频数据低频化,根据低频数据的周期对高频数据做平均或累加,或根据低频数据的周期选取高频数据的最新值,常用的集成法有简单平均法、移动平均法等。

2)将低频数据高频化——插值法

“插值”是将低频数据高频化,将低频数据映射到高频时间索引上,缺失值用插值补全,常用的插值计算方法有线性插值法、抛物线插值法、n阶拉格朗日插值法及newton插值法等。然而通过这两种方法建立的模型,由于人为的数据累加或内插,会引起的原始数据信息量的增加或丢失。

2.混频数据模型处理方法

对于混频数据,往往更倾向于直接构建混频数据模型以充分利用高频数据中的信息。混频数据模型不对混频数据做任何处理,而是充分利用原始数据的信息构建模型。当前处理混频数据的模型主要有混合数据抽样(MIDAS,MixedDataSampling) 模型和向量自回归移动平均 (VARMA)模型。

1)混合数据抽样模型

MIDAS使用参数控制的滞后权重多项式函数对高频滞后数据进行有权重的加总并构建模型,再通过数值优化和非线性的方法估计混频数据模型中的最优参数。在处理混频数据时,MIDAS模型因其算法简洁且不需改变原有数据的频率而得到广泛的使用。其基本模型可以表示为:  ,其中,低频变量为  ,高频自变量为  ,  是自变量的最大滞后阶数,  为残差项。  为权重,有多种选择,通常使用Beta多项式或指数Almon多项式。在给定时间T内,  在相同时间间隔内可被观测到m次。最后可通过非线性最小二乘法估算参数  。

2)向量自回归移动平均模型

VARMA将低频数据看作是有循环缺省值的高频数据,然后运用卡尔曼滤波方法估计具有状态空间形式的混频 VARMA 模型和缺省的高频数据。综上,混频数据模型无损利用高频数据信息预测低频数据,最大程度避免因数据同频处理过程中所引起的样本信息损失或人为信息虚增,在一定程度上可以提高模型的有效性和预测的准确性。

混频数据的处理方法

03Expectile回归模型分析混频数据

目前,混频数据分析模型未被广泛应用于金融风险测度的数据处理,针对金融风险测度中的混频数据问题仍使用前文提及的集成法和插值法。为了填补这一空缺,2021年6月学术界提出了一种新的模型,将MIDAS的数据处理方法引入常用的VaR和ES测度模型,即Expectile回归模型中,形成一种新的混频数据Expectile回归模型(ER-MIDAS),用于计算风险指标。Expectile模型作为分位数回归的衍生,将分位数回归的非对称绝对值损失函数修改为了非对称平方损失函数,Expectile为使非对称平方损失函数最小时的解,常在计算VaR和ES指标时得到使用。因此相较于传统的分位数回归类模型,Expectile回归更容易获取协方差函数。

风险测度的计算则可以通过Expectile和quantile的对应关系,建立Expectile与指标间的数值关系从而得到ES和VAR的估计值。Exceptile模型中的自变量和因变量存在线性关系,表达式通常为:  ,其中  为Exceptile水平,参数  的估算可以通过最小二乘法结合损失方程获得。

因此结合MIDAS和Expectile回归模型产生的Expectile混合数据抽样(ER-MIDAS)回归模型能够直接对原始数据进行处理,选择高频数据作为自变量测度低频的Expectile值,通过利用高频数据中的有效信息提高风险度量的准确性,其表达式为:  参数  的推算可用非对称最小二乘法,优化可得  。其中  为经验损失函数,  为非对称二次损失函数。而风险指标可以依据Expectile值和ES间的线性关系进行间接计算。

综上,由于MIDAS模型在处理混频数据时算法简洁且不需改变原有数据的频率;Epectile回归模型在测量时相较于其他传统方法可以更精计算VaR与ES,混频数据Expectile回归模型(ER-MIDAS)通过结合Epectile回归模型和MIDAS模型,在不改变原有数据频率的前提条件下直接对混频数据进行建模分析。

一是突破了传统回归模型对同频数据要求的限制,二是通过高频数据中更为完善的信息提高风险度量的准确性,为金融机构提供了新的风险测算模型。三是在测度方面因为使用平方损失函数,估计算法较为简洁明了且无需进行分布假设,较之于传统模型具有更好的表现,可以同时充分利用不同频率数据中包含的有效信息以得到相对传统处理模型更为准确的结果。

但该模型并非放之四海而皆准,例如在极端分位数的水平表现不如非极端的情况,该模型并不能很好处理极端事件发生的场景,而更适合运用于日常风险的监测和管理,同时亦适合金融机构实施稳健的风险管理。

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询