【华西金工】行业景气驱动模型的动态改进与因子拆解

admin2年前研报906


摘要

中观因子的变化蕴含丰富的信息

中观因子可以反映行业上下游的供需关系、价量情况,为行业景气变化提供预测。而普遍的行业景气提升也预示着市场环境向好,基于中观因子变化的大盘择时策略进一步展示中观因子的有效性。在本篇报告中,我们通过对以往的中观因子进行分类与删减,降低共线性对模型的影响,同时放弃了lasso等特设稀疏性方法对模型的改造,直面高维数据影响。


滚动窗口回归可使策略收益更上层楼

滚动窗口的动态模型在参数的计算上可以不断纳入各项指标最新数据,这可以使模型的表现获得质的提升,动态模型的表现明显强于静态模型,尤其在2020年以来新冠疫情爆发,经济形势急速变化的背景下,以往数据得到的静态模型逐渐不能满足需要。而在疫情爆发9个月后,动态的滚动窗口回归模型逐渐适应新形势,与静态模型的差距越来越大。我们使用了滚动窗口的方式对行业景气驱动模型进行了动态改进,以期模型能够纳入兼容最新数据,最终使模型的预测效果获得显著提升。相对于行业平均收益,根据模型推荐选取的前五大行业,其年化超额收益高达16.90%,信息比率达1.54,月度胜率达65%。


行业驱动因素拆解:以食品饮料行业为例

        我们可以通过更加深入的观察回归的参数了解到各因素对回归结果的影响力。以食品饮料行业为例。从宏观角度来看,当前食品饮料行业受M2同比增速、各项贷款余额等货币与信贷指标对食品饮料行业影响较大。货币政策的放松、尤其是M2增速的提高对该行业的增长有着显著的推动作用。从行业角度分析。糖、啤酒、软饮料、食用油的产量是近期影响力较大的行业因素。综合来看,该行业当前的景气情况主要受宏观经济形势影响。

风险提示

本模型采用量化方法通过历史数据统计、建模和测算完成,结论在极端市场环境变化中有失效的风险


1.基于行业景气变化因子的择时策略

前三篇研究报告我们通过梳理行业逻辑,考虑供给、需求、成本、产量等因素,分析行业上下游产业链,从行业基本面的角度,选取出了与行业景气相关的数百个行业中观因子。并基于中观因子与行业景气之间的相关性强弱,从中观因子中筛选出了若干领先因子。本系列第一篇研报《基于行业景气模型的行业轮动》中,我们依据历史的领先因子与行业超额收益之间的关系,构建了行业超额收益预测模型,依据预测的超额收益选择行业。本系列第二篇研报《行业景气变化因子驱动的行业轮动》中,我们介绍了利用领先因子变化构建行业景气变化因子,开发了基于行业景气变化因子的行业轮动策略,取得了较好的效果。本系列第三篇研报《行业景气变化因子驱动的择时策略》中,我们利用行业景气因子进行了大盘的择时。行业轮动策略的有效性,得益于我们选取的中观因子含有丰富的信息,使用它们可以较为准确的预测超额收益或判断行业景气变化方向。在本篇报告中,我们回归到最初的行业轮动模型当中,修正了部分因子停止更新带来的影响后,我们改变了因子的选取方式,使用了对阈值敏感度较低的模型,同时将固定参数的静态模型修改为滚动窗口回归的动态模型,以期随时纳入最新数据,剔除停更数据,提高模型可靠性。

1.1.领先因子的选取

我们按照申万一级行业分类,剔除了“综合”行业后,逐一行业进行了研究和梳理,寻找了一系列领先因子指标。由于行业特性不同,各个行业的具体因子选取的角度略有不同,但基本遵循产业分析的一般思路。首先,我们分析行业内主要产业的逻辑和经营模式,寻找相关联的宏观指标,再从上游来寻找对生产环节影响较大的指标,从下游寻找驱动销量变化的信息源,并综合的梳理成本、库存、供给、需求变化的逻辑,最后关注市场情绪的变化。按照这样的方法论,我们构建了涵盖数百个因子的领先因子池。其中部分宏观因子如下表所示。

部分行业领先因子如下表所示。

行业景气模型的主要逻辑是假定行业的超额收益来自于多个方面,我们力图从基本面的视角选取指标,对超额收益进行分解。

1.2.行业景气模型的建立

在以往的模型中,我们通过将行业指数收益与各同步指标进行单一变量线性回归,根据回归模型的R2筛选出各行业显著的领先指标。然而在实际上,行业的表现往往不是少数指标决定的,而是上下游数十种影响因素相互作用的结果,根据单一指标对行业的R2对指标的进行筛选不一定能够提高模型的预测效果,我们需直面高维数据的问题。故而在本篇报告中,我们直接使用各行业的领先指标与行业收益进行回归,其回归模型如下。

其中,为行业i的行业指数未来一月收益,为行业i的第k个领先因子。
在因子线性回归的过程中,有一个问题需要关注:数据的时效性。不同于价量数据,很多因子的发布并不实时,当月可用值与实际值之间往往存在一定的偏差。因此,我们在计算前统计当前时点与最新可用数据发布期之间的差距,为每一个指标计算“因子滞后时间”。计算时我们根据此前统计的各因子滞后时间,推算出在该月份最新可用数据,并利用该数据作为自变量进行线性回归,以保证不受未来信息对模型结果的影响。
通过回归模型得到各因子的参数后,我们即可使用最新数据预测各行业下一期的收益率,并在每月月底配置预测收益最高的五个行业构建择时策略。

2.行业景气模型的改进

2.1.中观因子的处理

在以往的报告中,我们选取了42个宏观因子与552个行业因子构建固定系数的行业景气模型。在后来的应用中,我们发现模型中存在因子停止更新、同一因子环比、同比、增量数据均存在等情况。为提高模型稳定性,我们需要对原模型的因子进行处理。
不同行业的中观因子数据特性不同,常见的数据包括环比数据、同比数据、价格指数、利率、估值指标等,数据类型各不相同。我们将宏观与行业的总计594个因子划分为四类:总量、增量、环比、同比。并对不同类型的数据进行一定的处理。除环比与同比数据外,我们将指数、价格、存货、利率、企业数量等划分为总量数据;对产量、销售量等数据划分为增量数据。对于总量型数据,由于上期与当期变化通常较小,我们将其直接转换为环比数据;对于年度内累计的数据,我们将其转换为月度的增量数据,而对于增量型数据,由于往往两期之间的变化较大,如产量等,常常出现当期值较上期值高出数倍等情况,我们将该值转换为当期值与过去十二期均值的比值数据。对于环比、同比类数据我们尽可能保留原值。最后,我们将同一指标的不同类型数据进行删减,优先保留其环比数据(包括总量数据转换来的环比数据),其次为增量数据,最后为同比数据。最终所有指标在量纲上接近。将594个指标删减为434个。

2.2.模型的动态改进

2.2.1.基于共线性的因子的筛选对策略提升效果有限

在以往研究中,量化模型往往倾向于使用非常少的因子,常见的模型如Fama-French三因子、Carhart五因子、Novy-marx四因子等,往往将证券收益解释为市场、规模、价值、动量、盈利、杠杆、财务等少数几个因子。这是由于以往的经济学假说往往只能假设出过于理想的极简情况,而单一的理论逻辑往往不能包含太多的变量,否则将难以自圆其说。与此同时,而市场上所能够找到的数据量则极其庞大,对证券价格能够产生影响的因素错综复杂,为了能够得到逻辑上的解释,人们往往采取各种手段对数据进行降维处理,最终仅留下少数解释性较强的因子建立模型。但在实际的应用中,少数因子对市场的预测效果十分有限,将市场表现解释为少数因子的假设也是不合理的,我们需要直面高维数据的问题。

在最初的构想下,本文的行业景气模型也采用了各种因子筛选的手段。如最初的行业同步指标划分、lasso方法、逐步回归等方法。但在实际的应用中我们发现,这些方法对模型预测效果的提升是存疑的,如lasso方法的提升十分有限且依赖于合适的参数,逐步回归方法则反而使测试期模型表现下降。

最后,我们放弃了以往的行业领先指标的筛选,除去一些必要的处理外,如上文中相同指标因子仅保留一个,不同类型指标尽可能处理为环比数据外,不再进行其它人为的因子筛选,最终纳入模型的因子由模型本身的逻辑决定。

2.2.2.因子系数随时间而变,滚动窗口回归效果显著

我们知道,证券的收益率受到多种因素的影响,且这些因素的影响往往不是一成不变的。以往固定参数的回归模型,其模型效果会随着时间的流逝逐渐下降。而训练集与测试集的划分,往往使得用于计算模型的参数的数据还停留在数年前。为了将最新数据也纳入考量,我们在以往模型的基础上,将回归窗口改为滚动模式,即每期计算的因子系数均为该期能使用的最新数据回归得到,其中滚动窗口为过去八年。此外,由于各时间截面下的参数都是最新得到的,即使划分了训练集与测试集,模型与策略的构建方式亦不受影响,滚动模型并无划分训练集测试集的必要。

滚动窗口的动态模型在参数的计算上可以不断纳入各项指标最新数据,这可以使模型的表现获得质的提升,下图为不同模型下,进行行业轮动的策略表现。可以看出动态模型的表现明显强于静态模型,尤其在2020年以来新冠疫情爆发,经济形势急速变化的背景下,以往数据得到的静态模型逐渐不能满足需要。而在疫情爆发9个月后,动态的滚动窗口回归模型逐渐适应新形势,与静态模型的差距越来越大。
从策略表现来看,过去四年,滚动回归模型年化收益达29.04%,较普通回归模型高出6.87%,较行业平均高出16.91%,同时月度最大回撤较普通模型提高2.9%,较行业平均降低4.76%。相较于行业平均指数,滚动回归策略的信息比率达1.54,月度胜率达65%。
综合上面的内容我们可以看出,即使因子数量较多,模型的预测效果仍旧十分出色。下面我们以食品饮料行业为例,深入挖掘这行业景气度的来源。

3.行业驱动因素拆解

多元线性回归模型是一个逻辑基础较为坚实的模型,我们可以通过更加深入的观察回归的参数了解到各因素对回归结果的影响力。各因子参数乘以各因子的值即为该因子对预测收益的贡献,最终的行业预测收益即为各部分预测收益之和。由于篇幅有限,我们不能对因子一一展示。通常情况下,多数宏观因子与行业因子的相关性是比较低的。我们将所有因子分为宏观与行业两部分,并分别展示这两部分对预测收益的贡献。图7展示了各时间段宏观因子对各行业收益的影响。

除所有行业共有的宏观因素外,各个行业分别有自身的行业因子指标。图8则展示了各时间段行业因子对各行业收益的影响。

宏观因素影响与行业因素共同构建出模型预测收益,图9则为模型预测收益的汇总。其中红色标出的是各时间截面上预测收益靠前的5个行业,绿色为预测收益靠后的5个行业。最右侧的策略超额则为预测收益靠前的5个行业构建的行业轮动策略的超额收益。

由于模型中包含的因子数量众多,我们不能一一分析,下面我们以食品饮料行业2023年2月的数据为例,观察各因子对该行业预测收益的贡献,找出这一时期对行业收益影响较大的因素。
在观察各因素对行业景气程度的影响时,我们需要关注各指标的相关性,将高相关性的指标视为一个整体。由于相关性的影响,单个指标可能的预测收益贡献可能会过大。如下表中,“金融机构:各项存款余额:同比”指标与“M2:同比”指标对预测收益的贡献都非常的高。但实际上,“金融机构:各项存款余额:同比”、“金融机构:各项贷款余额:同比”、“M2:同比”、“M1:同比”四项各项指标间的相关性均在0.9以上。
从下表可见,2023年2月份对食品饮料行业影响较大的因素为信贷与货币因素,其次为糖与食用油产量的行业因素,此外其它宏观因素与行业因素对模型的影响亦不容小觑。
从宏观角度分析,结合图10可以看出,M2同比增速与金融机构存款余额增速指标基本重合,M1同比增速指标则波动较大。单独取出这四个指标,计算其与食品饮料行业未来一月的收益率序列相关性,可以发现其结果均为正相关。但在整体的回归中,其回归得到系数会出现正负相抵的情况。整体而言,这四项指标对预测收益的贡献为12.6%。结合四个指标的参数值情况,可以看出货币政策的放松、尤其是M2增速的提高对该行业的增长有着显著的推动作用。
从行业角度分析。受限于农作物的生长周期,许多食品原材料的生产有着明显的周期性。其中,糖、酒、软饮料、食用油的产量是近期影响力较大的行业因素。
综合来看,当前行业因素总体对食品饮料行业的预测收益的贡献为-1.5%,宏观因素为7.0%。该行业的景气情况主要受益于宏观经济形势的好转。

4.小结

在本篇报告中,我们通过对以往的中观因子进行分类与删减,降低共线性对模型的影响,同时放弃了lasso等特设稀疏性方法对模型的改造,直面高维数据影响。同时,我们使用了滚动窗口的方式对行业景气驱动模型进行了动态改进,以期模型能够纳入兼容最新数据,最终使模型的预测效果获得显著提升。同时,通过深入挖掘各因子的实际影响,我们分析了当下行业景气度差距的主要来源,同时验证了模型的逻辑基础。
然而,当下的模型仍然面临两个问题。一方面为因子数据的问题,各类因子的数据五花八门,需要投入大量精力进行整理;而在因子的挑选上过度关心往往会导致模型具有较高的过拟合性,两者间的平衡需仔细把握,我们目前的处理方法为主要关注因子数据类型的统一,此外仅在有坚实的行业逻辑条件下进行因子的筛选。另一方面,目前的模型本身仍然基于最经典的线性回归模型,这样的模型虽然具备较高逻辑性与透明度,但在面对高维数据时仍力不从心,未来我们将致力于解决如何从大量有帮助的因子之中提取更为准确的预测性信息,进而使得模型在样本为可以获得更优异的表现。

5.风险提示

本模型采用量化方法通过历史数据统计、建模和测算完成,结论在极端市场环境变化中有失效的风险。

分析师与研究助理简介

杨国平:复旦大学博士,华西证券研究所副所长,金融工程首席分析师。曾任申万研究所董事总经理,金融工程部总监,首席分析师,25年证券从业经验。

王祥宇:中国科学院计算机博士,华西证券研究所金融工程资深高级分析师,资产配置FOF与智能量化组长。6年金融工程研究经验,在多因子选股、资产配置行业配置、基金研究等领域具有丰富的研究经验。

杨兆熙:复旦大学金融硕⼠,2020年11月加⼊华西证券研究所。主要研究领域为基金研究。

分析师承诺

作者具有中国证券业协会授予的证券投资咨询执业资格或相当的专业胜任能力,保证报告所采用的数据均来自合规渠道,分析逻辑基于作者的职业理解,通过合理判断并得出结论,力求客观、公正,结论不受任何第三方的授意、影响,特此声明。

华西证券研究所:

地址:北京市西城区太平桥大街丰汇园11号丰汇时代大厦南座5层

网址:http://www.hx168.com.cn/hxzq/hxindex.html

注:文中报告节选自华西证券研究所已经公开发布研究报告,具体报告内容及相关风险提示等详见完整报告。

证券研究报告:《【华西金工】行业景气驱动模型的动态改进与因子拆解——行业景气轮动研究之四

报告发布日期:2023年3月27日

分析师:

杨国平 分析师执业编号:S1120520070002

王祥宇 分析师执业编:S1120520080004  

杨兆熙 分析师执业编号:S1120523010001

联系人:杨兆熙  邮箱:[email protected]

联系人:王祥宇  邮箱:[email protected]

联系人:杨国平  邮箱:[email protected]

重要提示:

《证券期货投资者适当性管理办法》于2017年7月1日起正式实施。通过本订阅号发布的观点和信息仅面向华西证券的专业投资机构客户。若您并非华西证券客户中的专业投资机构客户,为控制投资风险,请取消订阅、接收或使用本订阅号中的任何信息。因本订阅号受限于访问权限设置,若给您造成不便,敬请谅解。市场有风险,投资需谨慎。

法律声明:

本订阅号为华西证券金融工程团队设立及运营。本订阅号不是华西证券研究报告的发布平台。本订阅号所载的信息仅面向华西证券的专业投资机构客户,仅供在新媒体背景下研究观点的及时交流。本订阅号所载的信息均摘编自华西证券研究所已经发布的研究报告或者是对已发布报告的后续解读,若因对报告的摘编而产生歧义,应以报告发布当日的完整内容为准。

在任何情况下,本订阅号所推送信息或所表述的意见并不构成对任何人的投资建议。华西证券及华西证券研究所也不对任何人因为使用本订阅号信息所引致的任何损失负任何责任。

本订阅号及其推送内容的版权归华西证券所有,华西证券对本订阅号及推送内容保留一切法律权利。未经华西证券事先书面许可,任何机构或个人不得以任何形式翻版、复制、刊登、转载和引用,否则由此造成的一切不良后果及法律责任由私自翻版、复制、刊登、转载和引用者承担。

本篇文章来源于微信公众号: 华西量化研究

本文链接:https://kxbaidu.com/post/%E3%80%90%E5%8D%8E%E8%A5%BF%E9%87%91%E5%B7%A5%E3%80%91%E8%A1%8C%E4%B8%9A%E6%99%AF%E6%B0%94%E9%A9%B1%E5%8A%A8%E6%A8%A1%E5%9E%8B%E7%9A%84%E5%8A%A8%E6%80%81%E6%94%B9%E8%BF%9B%E4%B8%8E%E5%9B%A0%E5%AD%90%E6%8B%86%E8%A7%A3.html 转载需授权!

分享到:

相关文章

成长等因子继续走弱,北向资金转为大幅净流入——投资宽角度周报

成长等因子继续走弱,北向资金转为大幅净流入——投资宽角度周报

风格动态配置跟踪从本周表现来看,估值、红利、低波等因子继续表现优秀,同时盈利、成长因子有效性持续下降。北向资金周跟踪净流入行为:北向资金转为大幅净流入,本周净流入198.44亿元。从资金结构来看,本周...

波动率因子表现出色,中证500增强组合本周超额0.99%【国信金工】

波动率因子表现出色,中证500增强组合本周超额0.99%【国信金工】

  主 要 结 论  一、本周指数增强组合表现沪深300指数增强组合本周超额收益0.26%,本年超额收益0.02%。中证500指数增强组合本周超额收益...

四成私募中证1000指增产品年内超额达6%【国信金工】

四成私募中证1000指增产品年内超额达6%【国信金工】

  报 告 摘 要  一、私募基金市场动态截至2023年4月末,存续私募证券投资基金99775只,存续规模5.94万亿元,环比增长4.86%...

北向净买入计算机、机械,国防军工、电新景气度提升居前——德邦金工择时周报20230625【德邦金工|周报】

北向净买入计算机、机械,国防军工、电新景气度提升居前——德邦金工择时周报20230625【德邦金工|周报】

 摘要 投资要点A股整体下跌。A股整体领跌于全球股市,其中中证1000下跌1.81%;美国股市整体表现下跌,其中标普500下跌1.39%;欧洲股市也跟随下跌,其中英国富时100下跌...

【广发金融工程】小市值率先止跌回升(20231015)

【广发金融工程】小市值率先止跌回升(20231015)

摘要Abstract最近5个交易日,科创50指数涨0.44%,创业板指跌0.36%,大盘价值跌0.56%,大盘成长跌0.36%,上证50跌0.72%,国证2000代表的小盘涨0.32%,电子、汽车涨幅...

【方正金工-ETF深度报告】ETF基金投资者画像研究(持有人篇)

【方正金工-ETF深度报告】ETF基金投资者画像研究(持有人篇)

本文来自方正证券研究所于2023年5月19日发布的报告《ETF基金投资者画像研究(持有人篇)——ETF基金系列研究之二》,欲了解具体内容,请阅读报告原文,分析师:刘洋 S1220522100...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。