【中信建投金融工程】深度专题124:基金长期能力因子应用——利用优选基金构造行业轮动策略
重要提示:通过本订阅号发布的观点和信息仅供中信建投证券股份有限公司(下称“中信建投”)客户中符合《证券期货投资者适当性管理办法》规定的机构类专业投资者参考。因本订阅号暂时无法设置访问限制,若您并非中信建投客户中的机构类专业投资者,为控制投资风险,请您请取消关注,请勿订阅、接收或使用本订阅号中的任何信息。对由此给您造成的不便表示诚挚歉意,感谢您的理解与配合!
核心结论
卡尔曼滤波各种方法对比
相同配置单核运行下,卡尔曼滤波相较于约束Lasso耗时仅为1/10,使用上期真实持仓收敛和默认初值收敛没有太大差别,投影法和约束法对比,二者对于仓位估算的精度差异并不明显,投影法平均RMSE0.8%,约束法平均RMSE0.78%。在18个行业上约束法强于投影法,但在少部分行业约束法的精度下降较大。
卡尔曼滤波和Lasso对比
Lasso的平均RMSE(1.9%)比用卡尔曼滤波(0.8%)更高,在单个基金的估算精度上,从2010年至2022年底,卡尔曼滤波方法在10个板块和30个行业上,在单基金的估算精度中均能体现出更高的精度。
“优中选优”——从仓位测算到行业轮动
我们发现基于长期能力因子的仓位变动空头效应较强,时点配置多头效应较强,因此基于此的行业轮动月频策略多空年化36.71%,其中多头部分年化超额20.97%,空头部分年化超额-11.51%。使用动态参数构造的行业轮动组合在2018年5月至2023年5月期间,年化多头超额17.27%,年化空头超额-16.35%,多空年化40.2%。
仓位测算到选基因子构造
使用基金周度估算行业仓位和行业指数构造基金模拟净值,模拟净值相对基金指数作为行业配置Alpha,真实净值和模拟净值对比记为选股Alpha, KF-Alpha(选股)月频IC均值7.2%,ICIR0.45,年化多空收益9.02%;季频IC均值8.65%,ICIR0.51,年化多空收益7.49%。
风险提示:1、基金过去业绩不代表未来收益;2、量化模型存在失效风险;3、仓位估算方法不代表真实仓位;4、选基Alpha因子不具备收益预测效应;5、行业轮动数可能存在样本外失效问题。
主要内容
一、引言
在报告《基于主题分类的基金行业轮动FOF策略》中,我们介绍了基于公募基金仓位的行业轮动方法,这个方法在后续的定期年度以及半年度策略报告中均有跟踪。
我们认为公募股票型基金的基金经理对板块仓位的看法体现着市场关注的焦点,如果能够构造指标反应基金经理对板块轮动的方向把握并跟踪,就可以跟随市场上最优秀的人进行行业轮动从而获取超额收益。而公募基金的全持仓披露存在两个问题:一是存在滞后性,公募基金半年报及年报披露期相较于披露时点有两个月以上的延迟,二是频率过低仅有6月和12月披露,这导致很难使用现有数据构造模型。
因此我们基于基金仓位估算结果构造行业轮动模型,在基金仓位估算部分,基金池选择并入二级分类18个月以上的普通股票型基金和偏股混合型基金。由于中信一级行业分类共有30个,短期内会出现同涨同跌情况,使用回归时共线性问题会导致对行业仓位的估算出现较大误差,所以我们将30个中信一级行业分类人为降维至10个板块进行分析。
我们以周度为频率,从2010年至2020年每周末使用前40天日数据依照约束Lasso方法(关于此方法我们会在下文进行介绍和对比)对公募股票+偏股基金板块仓位进行测算。由于周度频率测算波动较大,在此基础上我们做了MA(12),即一个季度的平滑处理。
我们使用估算板块仓位构造动量策略,使用过去半年至过去一个月板块变动最大的板块构造持有一个月的多头,为了防止通道效应,策略分为4通道。策略相对十个板块平均持有,从2011年至今年化超额收益率7.84%,多空收益年化14.55%。今年以来多头相对板块基准超额收益1.5%,多空收益5.23%。
该方法构造的行业轮动组合每个月亦作为六维度行业轮动的子信号之一发挥作用,在长达2年的样本外跟踪中,我们对该方法有以下思考:其一:板块的降维依托于30个行业之间的超额收益率的相关性和上下游关系人为分解,但是随着时间变化,板块内部各个一级行业之间收益率可能发生分化,需要及时对板块划分进行调整。
其二:依靠全市场偏股+普通股票型基金经理的行业观点可能并不够准确,如果能够依托于我们对于基金经理核心能力的把握而优选的基金组合(见报告《基金长期能力因子构建之二——基金选股能力因子应用》)来构造行业轮动策略,或许可以实现“优中选优”的思路,对行业轮动策略进行进一步的增强。
本文中,我们首先简要介绍了卡尔曼滤波方法对于基金仓位的测算,在能够实现更细致的仓位测算的基础上,我们再回到利用主动权益基金仓位构造行业轮动策略的开始,逐步对从基金到行业轮动策略的构造过程进行改造,实现更强的效果。
二、卡尔曼滤波测算基金仓位和约束Lasso回归简介
2.1
卡尔曼滤波思想简介
卡尔曼滤波(Kalman filter)是一种高效率的递归滤波器(自回归滤波器),它能够从一系列的不完全及包含噪声的测量中,估计动态系统的状态。卡尔曼滤波会根据各测量量在不同时间下的值,考虑各时间下的联合分布,再产生对未知变数的估计,得名自主要贡献者之一的鲁道夫·卡尔曼。
卡尔曼滤波可以看作两个过程的结合,预测过程和更新过程。其中:
在基金仓位估算的过程中,x_k是估算仓位向量,z_k是k日可观测基金收益,H_k是k日可观测行业指数收益,因此预测过程可以简述为:使用k-1的信息和k的行业指数收益,估算先验的x_(k|k-1) 和z_(k|k-1),再使用更新过程中后验的z_k更新x_(k|k)。
在应用卡尔曼滤波的过程中,有两个问题需要注意:(1)是否使用披露持仓作为x_0;(2)对于更新过程中的x_k如何施加约束。
在(1)中,我们分别使用可得全持仓作为x_0和全行业平均持仓作为x_0进行测试,当使用全行业平均持仓作为初值时,统一采用120日窗口进行迭代,而使用真实持仓的情形下,使用披露期到计算时点窗口长度进行迭代(至少60日)。
在(2)中,基金仓位有各行业持仓均大于0和相加小于等于1的限制,我们使用两种方式将约束加入卡尔曼滤波的迭代,首先是投影法:在每次计算完后统一作sign和归一化处理;其次是根据约束Dx=d将x_k 和V_(k|k)进行调整:
2.2
约束Lasso简介
约束Lasso方法也是我们在行业轮动策略中应用的方案。在时点t,使用板块指数过去1个月收益率(〖Industry_r〗_t^i)对万得全A(881001.WI)同期收益率(R_t)作线性回归并取残差resid作为板块的超额收益率(〖Indus_exr〗_t^i),同方法获取基金f的超额收益率(〖fund_exr〗_t^f)。
将基金f的超额收益率对10个板块的超额收益率依照约束求解:
这里的d来自于基金前一年仓位的平均值向下分级靠档,如果没有前一年的仓位值则使用最近一年的。使用有约束的半衰加权Lasso回归,即在最小二乘回归中,将残差平方和目标式乘以随时间半衰的权重w_i后加L1范数作为惩罚项,这样能够保证稀疏的同时使距离t时点越近的信息在回归中占有更高的权重:
卡尔曼滤波选用指数为30个中信行业、中债总财富指数和万得货币市场基金指数估算;约束Lasso主要使用10个板块的收益率进行估算。两者回测时间均为2010年至2022年底,每个年度的半年报和年报。
在Lasso和KF的估算精度对比上,我们使用常用的RMSE(Root Mean Square Error)进行度量。
三、卡尔曼滤波测算基金仓位和约束Lasso回归对比
3.1
运算时长对比
运算速度上,相同配置单核运行下,卡尔曼滤波相较于约束Lasso耗时更低。约束Lasso平均单期耗时2156.24(s);卡尔曼滤波平均单期耗时137.30(s)
3.2
默认初值vs持仓初值
从前面的简介可以看出,使用卡尔曼滤波真实持仓收敛法实际上用到了120个交易日(近似)前的真实仓位,以及使用长达120天进行迭代,因此和平均仓位初值120日迭代收敛两者是某种意义上的控制变量法,下文中,我们用真实初值法表示用120日收敛且初值为真实持仓的方法,默认初值法表示后一种。在多数行业,使用上期真实持仓收敛和默认初值收敛没有太大差别,在部分行业,使用上期真实持仓收敛相比默认仓位更贴近真实仓位。
下方的农林牧渔、消费者服务、新能源和银行就分别体现了四种方向的误差,这四种误差也基本涵盖了两种方式的差异。农林牧渔行业表现为默认初值和持仓初值在近年来测算结果差异不大,但相距真实仓位均有误差;银行则体现为真实初值相比默认初值有更好的估算精度。
而消费者服务则是默认初值和真实初值均有误差,但是真实初值相比默认初值精度稍高,电力设备及新能源行业中使用真实初值和默认初值均能较好对基金在行业上的配置进行估算。
默认仓位120的RMSE(1.3%)比用上期真实仓位(0.8%)更高,具体到30个行业上,使用上期真实仓位收敛均能比120日窗口默认值收敛有更好的精度。其中,在医药、银行和石油石化等行业上,真实初值法相比默认初值法有明显的精度提升。
下图横轴为默认初值法下的迭代天数,纵轴分别为RMSE和平均被测基金。由于我们设置估算基金需要成立18个月以上,迭代天数均在18个月期限内,因此迭代天数地提升对于被测样本数量影响不大。
同时随着迭代天数增多,基金仓位估算地精度逐渐提升,且这种提升并非来源于样本量的减少。
3.3
投影法vs约束法
卡尔曼滤波投影法和约束法对比,二者对于仓位估算的精度差异并不明显,投影法平均RMSE0.8%,约束法平均RMSE0.78%。在18个行业上约束法强于投影法,但在少部分行业约束法的精度下降较大。例如电力设备及新能源和计算机行业。
单个基金的精度对比上,投影法平均RMSE3.02%,约束法平均RMSE2.94%。
3.4
卡尔曼滤波测算基金仓位和约束Lasso估算结果
具体卡尔曼滤波和Lasso对行业以及板块的估算结果对比我们放在附录中以供参考。
两种方法RMSE对比,Lasso的平均RMSE(1.9%)比用卡尔曼滤波(0.8%)更高,具体到中信一级行业,在各个行业卡尔曼滤波法均能体现出比约束Lasso更高的估算精度,尤其是在电力设备及新能源、计算机和食品饮料行业。
包括最后一张图亦能看出,卡尔曼滤波在最终权益仓位的测算上相比Lasso也更加精确,几次市场中的巨大仓位变动均能精准识别。
在单个基金的估算精度上,计算单基金RMSE后各期截面平均,可以看到从2010年至2022年底,卡尔曼滤波方法在10个板块和30个行业上,在单基金的估算精度中均能体现出更高的精度。
3.5
卡尔曼滤波测算的缺陷
使用真实持仓迭代收敛的卡尔曼滤波法测算基金仓位相对于传统的测算方法已经有非常大的优势,在运算速度和估算精度上均能有非常大的提升。但其仍然存在缺点,我们按照周度测算基金仓位,下图是周度仓位仓位的结果,可以看出很明显的断层效应。由于每次4月和9月获取全持仓后就会使用最新的全持仓进行迭代,因此在每年的4月初和9月初部分行业相比于之前月底的估算值会有较大变动。因此真实持仓收敛的卡尔曼滤波作为时点计算精确度较高,统计趋势则只能计算4-8月,9-3月的变化,或使用平均初值多日迭代。
365日默认初值计算各行业仓位周度变动。
四、优中选优”——从仓位测算到行业轮动
4.1
仓位测算到行业轮动信号测试:全体主动权益基金的仓位动量效应
本章节中我们对于行业轮动策略的测算如不做特殊说明均是使用中信一级行业,回测区间从2010年至2022年5月截止。
首先我们从基金仓位的动量效应入手,测试主动权益基金的行业仓位变动比例能否对市场未来的热点产生预测效应。
基金滚动R期取MA,滞后S期,计算相比N期前的仓位变动率,这些参数是我们在之前的研究中所积累的经验,仓位滚动取MA是为了平滑高频仓位测算的波动,滞后配置行业则是我们发现在基金仓位变动中,可能会出现类似动量效应中在短期发生反转的效应,因此为了避免短期的反转而进行滞后。
在t期(周度)截面按照从高到低排列,选取前5个行业和后5行业分别组成多头和空头持有H期进行测试,同时为了防止通道效应,结果均做多通道处理;同时测试全体主动权益基金和仅使用非行业主题基金结果。
在不进行滞后和MA的情形下,主动权益基金短期的调仓在短频的持有期有正向的多空,长期调仓则在长持有期具有效力。
多空效果最好参数组(全体主动权益、月频、R12S8N12)如下。多空年化11.3%,其中多头年化超额4.24%,空头年化超额-6.3%。
在这种方法下,随着滚动平均和滞后期的变化,回看/持有策略的收益也会发生变化,稳定性较差。
4.2
仓位测算到行业轮动信号测试:优选基金的仓位动量效应
我们从主动权益基金中缩小范围,如果每一期我们只考察核心能力最优秀的基金仓位变动,并且进行一定的复制跟随,能否获得超过使用全体主动权益基金的行业观点结果。
具体做法如下,在每个时点截面,选取可得信息中长期能力因子排序前20的基金,这里的可得信息指长期能力因子的计算披露在每个月的3月和9月,在一年中的若干时点需要考虑到这一点。
根据20只基金的行业仓位测算平均,按照仓位配比排序,取前3只和后3只(3只即为前10%)配置多头和空头组合,月度调仓,由于长期能力因子从2016年开始,因此回测也从2016年开始计算,部分回看期较长可能会从2017年开始回测。
由于长期能力因子组合每半年会变动,因此断层效应同样会出现,我们只能尝试忽视这一点,毕竟造成断层效应的行业也是基金观点的一部分体现。
我们测试长期能力因子基金仓位变动构造的行业轮动组合效果,分别按照回看和持有进行测试,从热力图来看,优秀的基金观点呈现很明显的“长期仓位变动有效,短期仓位变动效果减弱”的特点。特别的,在我们测试的参数组中,回看期为48期的情形下,持有1周和4周都能获得较好的多空。
另外,使用长期能力优秀的基金构造仓位变动的行业轮动策略时,空头效应相比多头效应更加显著,即基金看好加仓的行业超额有限,但是基金公认摒弃的行业多半会有较差的收益。
我们以48周回看,月频持有为例:
4.3
仓位测算到行业轮动信号测试:放大优选基金的仓位配置
在最开始的板块测算中,我们曾经尝试过按照基金配置板块仓位高低,放大这种配置高低的效应构建行业轮动组合,具体的,每周我们挑选前3名板块和后3名板块作为多头和空头组合,以及不做任何筛选的10个板块作为基准,计算三个组合周度调仓的收益率,考察三个组合的超额收益。(由于综合板块一直处于所有板块的最后,故先不进行选择)
多头、空头和基准在2010到2021年底区间内的超额年化收益分别为4.52%、-3%和0.6%;三个组合在近三年来超额年化收益分别为6.25%、-6.8%和-0.7%;按照十个板块从高到低排列后,我们注意到除了持仓排名第一的有显著的超额收益外,后面几个排名的板块具有显著负超额收益。这种超额收益并不具备明显的单调关系,超额收益的下降更多来自于板块的人为划分,例如在较长时间段内,消费II板块都具有极高的持仓占比预测,而综合板块则更长时间内都是较低的持仓占比预测。
而在本节中,得益于更细致的行业测算和优选基金两方面的改进,使得放大基金的仓位配置获取收益变成可能。
我们使用截止2021年底的数据作为样本内,每周测算优选基金的仓位并进行滚动平均和滞后的处理,降频到月频后,每月末选取优选基金配置的前3个行业后3个行业(前10%,后10%)进行多头组合和空头组合的配置。
在样本期内最优参数下,样本期内多头超额19%,多空超额31.18%,样本期外(2022至2023年5月),多头下降至15.37%,多空下降至15.75%。
下面左图为样本期内多空收益波动比,右图为样本期外多空收益波动比,可以看到样本期内参数组扩展到样本期外后发生了最优参数发生改变,总体上看全样本滞后期在2期内,滚动期在12期内的参数均依然表现较好,但整体参数呈现滞后期缩短的趋势。
鉴于此,我们将多头部分表现较好的放大优选基金仓位配置和空头部分表现较好的优选基金仓位变动结合,构成我们基于长期能力因子的行业轮动策略:月频调仓,多空年化36.71%,其中多头部分年化超额20.97%,空头部分年化超额-11.51%。
4.4
仓位测算到行业轮动信号测试:动态参数调整
为了防止前文所述样本期内过度调参在样本期外失效的问题,在这里我们在每个月计算组合时,在过去时间段的多个参数组计算每组的收益波动比,将收益波动比最高的一组参数组输入进当月使用参数,计算该月多空行业组合。
我们保证最少有两年的数据用于参数寻找。因此回测从2018年6月开始。
和之前策略对比(之前为MA12期,滞后5期,10板块选1板块),无论是在多头还是多空上均提升明显。
在动态参数组的设置下,和静态样本期内最优参数组对比,在同样的时间区间下,年化多头从18.81%下降至17.27%,年化空头从-10.87%上升(此处表示效果增强)至-16.35%,全时段多空年化从33.3%上升至40.2%。
从各年来看,除了2018年策略多空收益反转外,其余各年均有良好表现。这一年主要是由于长期能力因子基金组合在2018年亦未跑赢基准导致。
五、仓位测算到选基因子构造
5.1
仓位测算到选基因子构造
在系列报告《基金长期能力因子构建》中,我们基于业绩分解的思想构造新的业绩拆分模型,将基金的择时、行业配置、选股和交易四项能力进行拆分,这种业绩拆分基于公开持仓,频率较低。本节我们将使用仓位测算的信息构造更高频率下的基金业绩拆分,并尝试构造选基因子。
使用基金周度估算行业仓位和行业指数构造基金模拟净值,模拟净值相对基金指数作为行业配置Alpha,真实净值和模拟净值对比记为选股Alpha,基金池仅统计最近一期股票仓位超过60%的主动权益基金。
以某偏股混合型基金为例,基金从2021年底开始,行业和选股均持续贡献正超额。
在选基层面上,以使用过去一年的KF-Alpha(选股),因子频率为月频,IC均值7.2%,ICIR0.45,年化多空收益9.02%;季频上,IC均值8.65%,ICIR0.51,年化多空收益7.49%。
和传统的CAPM-Alpha以及Carhart4-Alpha相比,在月频上KF-Alpha并未显示出优势,在季频上,KF-Alpha相比另外两种因子仅有小幅度提升,总体而言KF-Alpha因子的形态上并未展现出超越以往Alpha因子的特征。
六、结语
本文引入了当下流行的卡尔曼滤波仓位测算法,对方法使用过程中的诸多问题进行研究对比,并且和过往使用的Lasso法比较在公募主动权益基金行业仓位测算上的准确性,结果显示卡尔曼滤波方法比Lasso有更高的仓位估算精度。
同时,本文从仓位测算入手,分别向构造行业轮动组合和构造选基因子深入研究,在构造行业轮动组合方面,本文构造的行业轮动组合在2018年5月至2023年5月期间,年化多头17.27%,年化空头-16.35%,全时段多空年化40.2%。在选基因子上,使用仓位测算和业绩分解的思想,构造了KF-Alpha因子,月频 IC均值7.2%,ICIR0.45,年化多空收益9.02%;季频上,IC均值8.65%,ICIR0.51,年化多空收益7.49%。
本文亦有不足,在构造选基因子上,并未构造出大幅度超越现有因子的选基指标;在行业轮动组合上,整体构造虽然在经济学意义上可以解释,但是整体模型构造繁复,尽管通过一定的样本外稳定性测试,但是最终的效力仍然需要在未来不断跟踪修正。
附录:卡尔曼滤波和约束Lasso行业估算结果对比
风险提示:
1、基金过去业绩不代表未来收益,基于多种方法对基金收益处理后的收益数据同样不能代表基金未来业绩表现;
2、量化模型存在失效风险,从历史上看,由于风格变化、公募基金持仓结构变化等事件均可能导致长期能力因子失效从而影响行业轮动策略;
3、卡尔曼滤波和Lasso仓位估算仅为数学方法对基金行业仓位估算,并不代表基金真实行业仓位配置,同时可能有内生性误差导致最终结果的差异;
4、本文构造选基Alpha因子基于过去历史数据回测,不对未来基金收益做任何预测和保证;
5、行业轮动组合底层数据来源较多,可能存在样本外跟踪失效问题。
证券研究报告名称:《基金长期能力因子应用——利用优选基金构造行业轮动策略》
对外发布时间:2023年6月28日
报告发布机构:中信建投证券股份有限公司
本报告分析师:丁鲁明 执业证书编号:S1440515020001
免责声明:
本公众订阅号(微信号:鲁明量化全视角)为丁鲁明金融工程研究团队(现供职于中信建投证券研究发展部)设立的,关于金融工程研究的唯一订阅号;团队负责人丁鲁明具备分析师证券投资咨询(分析师)执业资格,资格证书编号为:S1440515020001。
本公众订阅号所载内容仅面向专业机构投资者,任何不符合前述条件的订阅者,敬请订阅前自行评估接收订阅内容的适当性。订阅本公众订阅号不构成任何合同或承诺的基础,本公司不因任何订阅或接收本公众订阅号内容的行为而将订阅人视为本公司的客户。
本公众订阅号不是中信建投证券研究报告的发布平台,所载内容均来自于中信建投证券研究发展部已正式发布的研究报告或对报告进行的跟踪与解读,订阅者若使用所载资料,有可能会因缺乏对完整报告的了解而对其中关键假设、评级、目标价等内容产生误解。提请订阅者参阅本公司已发布的完整证券研究报告,仔细阅读其所附各项声明、信息披露事项及风险提示,关注相关的分析、预测能够成立的关键假设条件,关注投资评级和证券目标价格的预测时间周期,并准确理解投资评级的含义。
本公司对本帐号所载资料的准确性、可靠性、时效性及完整性不作任何明示或暗示的保证。本帐号资料、意见等仅代表来源证券研究报告发布当日的判断,相关研究观点可依据本公司后续发布的证券研究报告在不发布通知的情形下作出更改。本公司的销售人员、交易人员以及其他专业人士可能会依据不同假设和标准、采用不同的分析方法而口头或书面发表与本帐号资料意见不一致的市场评论和/或观点。
本帐号内容并非投资决策服务,在任何情形下都不构成对接收本帐号内容受众的任何投资建议。订阅者应当充分了解各类投资风险,根据自身情况自主做出投资决策并自行承担投资风险。订阅者根据本帐号内容做出的任何决策与本公司或相关作者无关。
本帐号内容仅为本公司所有。未经本公司许可,任何机构和/或个人不得以任何形式转发、翻版、复制和发布相关内容,且不得对其进行任何有悖原意的引用、删节和修改。除本公司书面许可外,一切转载行为均属侵权。版权所有,违者必究。
中信建投金融工程深度专题报告回顾
(点击标题可查看历史文章)
【资产配置】
【因子选股】
【交易策略与衍生品】
深度专题7:2015年衍生品市场政策总结及交[自]易策略 |
【基金产品研究与FOF】
深度专题14:非传统型基金产品概述:躲不过的中国资本市场宏观对冲时代match 深度专题68:工具化、配置化、异质化之路——公募基金市场综述与展望 深度专题71:科创板发行制度解析及上市表现猜想——来自海内外的经验 深度专题77:因子投资热潮渐起,聪明指数未来可期——Smart Beta市场综述 深度专题81:权益仓位上升,偏股基金继续跑赢指数——基金分类与研究框架纵览 |
本篇文章来源于微信公众号: 鲁明量化全视角