用量化体系应对市场不确定性——中信建投金融工程2023年度投资策略报告
核心结论
预计A股整体重心显著上移
2022年多轮疫情冲击以来,中国经济已经处于长期趋势线以下,近期疫情政策调整后,产出缺口有望逐步回补。2023年中国经济处于投资时钟里的复苏期,通胀矛盾有限,同时外需压力较大,货币政策对内需回暖可能有更高的容忍度,预计维持中性偏宽松。从基本面来看,虽然外需压力较大,但房地产政策调整与债务出清类似于2014年底,内需经济企稳后有望带动指数重心显著上移。
对比32年前的日美经济剪刀差后的美国独立行情,其关键是其美国经济早于全球贸易见底,货币政策则多持续了12个月且后续也延续了宽松利率,与当前中国政策相似,类似于90年代的市场分化可能重现,A股或在全球衰退中走出独立行情。从相对估值来看,2022Q3-Q4 股债比价接近2019年初,股票相对债券具有较高性价比。
量化视角下的多体系行业跟踪
宏观因子方面,我们选择了多维度的宏观指标,对每个行业采用逐步回归法构建模型进行预测,按照预测值选前3行业的组合,2018年1月到2022年11月累计超额147%,年化超额20%。
行业基本面方面,通过梳理行业逻辑,筛选重要指标,选择其中和行业ROE、超额收益都具有高相关的指标构造单行业量化基本面择时策略,各行业的多空年化收益率均高于12%。
财务指标方面,基于正式财报信息构建行业财务指标,测试表明盈利和成长能力相关指标及其边际变化对行业的选择有参考意义。我们构造的复合财务因子,第一分组年化超额收益7.16%,夏普比率0.33。
分析师预期方面,以未来2个自然季度的ROE为目标,计算的行业成分股预期ROE上调比例、行业ROE变化值因子,超额收益率超过5%,夏普比率接近0.3。
基金资金流方面,基于有约束的半衰加权Lasso约束回归对股票型基金进行仓位估算,并基于此构造动量策略,使用过去半年至过去一个月板块变动最大的板块构造持有一个月的多头。策略从2011年至今年化超额收益率8.39%。
因子表现分化,风格切换显著
2022年因子表现机遇与挑战共存。从因子表现来看,市值类因子表现依旧稳定,基本面类(包括成长,价值等)因子相较于过去两年发生类明显的风格切换,高成长类因子表现逐渐减弱,低估值类因子表现有所增强。过去一年,整体市场发生了三次比较明显的风格切换,分别是3月,6月以及11月,导致整体因子的波动加剧。
公募指增产品跟踪——发力中证1000
存续的指数增强ETF产品共201只,1615.43亿元,沪深300,中证500和中证1000几类指增产品平均仓位分别为92.38%,90.74%和90.05%。不同基准指增产品今年以来胜率均超过80%,其中中证1000指数增强产品均跑赢基准,平均和中位超额均最高。中证500平均超额2.58%,竞争差异更大;沪深300超额中位最小。
不惧市场风格快速切换,建投500增强平稳上行。
我们构建的中信建投中证500指数增强策略从2011年1月1日到2022年12月11日累计绝对收益1090%,相对中证500累计超额849%,年化超额20.6%,其中2022年在市场风格轮动较为频繁的背景下,取得绝对收益-6.4%,超额收益11.24%,表现较为优异。
光伏Alpha+Beta属性突出,行业选股表现亮眼
光伏行业拥有卓越的Beta和Alpha属性。从2018年1月1日至2022年6月,光伏设备(申万)指数累计涨幅292%,在125个申万二级行业指数中排名第一,比行业平均收益率8.86%高出283%。不仅如此,光伏行业的Alpha也异常显著,行业内个股分化明显。通过行业内因子选股的方法,能够获得超越指数的alpha收益。
前瞻性挖掘个股信息,机构调研事件选股策略表现优异。
我们构建的机构调研事件选股策略从2016年1月到2022年7月31日,40天持有期组合累计收益259%,累计超额281%,年化超额中证500 22.5%,月度胜率63%,IR 0.70。40天持有期组合在2021年市场复杂的风格轮动下表现优异,绝对收益83%超额收益59%。
利用深度学习模型Deeplob从订单簿挖掘高频alpha
DeepLOB是基于CNN和LSTM结构的深度学习网络,用于预测限价订单簿的价格运动。DeepLOB网络在设计时,充分考虑了限价订单簿的数据结构与卷积神经网络之间的关系,能够挖掘出深层的订单簿特征。将模型应用于股票和可转债高频预测,能够取得显著的收益。
基于AutoML-Zero的因子挖掘框架AlphaZero
近几年机器学习发展迅速,以AutoML为代表的特征工程以及模型搭建也早以在工业界实现了广泛应用。将Google Brain团队提出的AutoML-Zero模型应用与因子挖掘领域,结合实际情况对模型做了相应的改进,构建了AlphaZero框架。通过结合中高频数据以及基本算子,利用正则化进化算法,能够进化出表现非常显著的个体因子。不仅能够应用于批量因子生成,还可以将其应用于现有因子的改进。
六维度行业轮动模型对外跟踪以来超额收益率11.47%
根据自上而下,结合宏观、量化基本面、财务因子、分析师预期、机构偏好、量价技术和资金流等维度,我们构建了六维度综合行业配置模型。自2022年2月开始对外跟踪以来,模型累计收益率4.81%,相对行业等权超额收益11.47%。
行业轮动FOF策略正超额
我们建立了基于规划求解的方案,将效果优秀的六维度行业轮动模型应用至基金选择上。今年以来主动权益FOF策略相对主动权益基金累计超额收益3.86%,被动指数基金组合绝对收益相对股票指数基金超额收益7.57%。
风险提示:模型为历史数据,存在失效可能。
主要内容
一、2022年市场回顾:疫情冲击下的经济与市场
1.1
市场表现:多重因素反复扰动,年初下行后宽幅震荡
2022年以来,在地缘军事冲突、海外央行面对不断超预期的通胀持续紧缩、国内区域性疫情反复扰动,近期防疫政策不断优化的背景下,权益市场自年初下行后宽幅震荡。
从宽基指数来看,包括上证综指、深证综指、中小板指、创业板指及上证50、沪深300、中证500以内的主流指数,年初以来跌幅在11%以上。
从行业指数来看,包括在全部的30个中信一级行业指数中,年初以来收益率为正的仅有四个,其中煤炭(27.78%)行业涨幅一马当先,各行业的涨跌幅中位数为-13.86%。
从风格指数来看,年初至今,稳定风格指数窄幅震荡,微涨0.28%,其余风格指数跌幅多超过7%,其中跌幅最大的为成长风格(-24.83%)。
1.2
A股宏观、财务数据回顾
从国内宏观数据来看,一季度,经济数据阶段性好转,但此后经济动能再次下行,于4月降至低点,伴随第一轮疫情冲击结束,5-6月PMI连续上行,但7-9月经济活动及内需消费再次受到疫情影响。
外需来看,当前可类比2008年同期,美国经济硬着陆风险高企,将继续对中国进出口和工业企业价格形成拖累。
上市公司业绩方面,三季度主要指数的单季度净利润增速同比仍在低位,与国内经济数据短期略有偏差,但行业板块的趋势符合预期,国内消费(以食品饮料为代表)与中游(机械、轻工、商贸、家电等)崛起是Q3财报的最大看点,银行业绩稳健回升更是A股重要的业绩拉动项。
1.3
A股流动性回顾
资金面上,北上年初至今累计流出771亿元,与去年同期相比大幅减少。
对偏向滞后的两融余额,自去年9月高点以来的下降趋势暂缓,近期呈低位震荡,若后续市场回暖,或转向上行。
公募基金方面,2022年1-11月,国内市场新成立基金1253只,募资规模12910亿元;而新成立的债券型基金规模在所有新成立基金中的占比最高,达67.27%。
1.4
后市展望:A股整体重心显著上移
2022年多轮疫情冲击以来,中国经济已经处于长期趋势线以下,在近期疫情政策调整后,产出缺口有望逐步回补,对2023年经济有重要拉动作用。
由于国内经济仍然在潜在经济增长之下、海外经济将继续快速下滑,预计PPI增速将持续回落。预计2023年国内货币政策仍将维持中性偏宽松。
美国90年代独立行情的关键因素,和当前有三个共同点:(1)流动性冲击最剧烈的时候结束,当年日本加息结束对应当前美国加息尾声;(2)从时间周期来看,当年日本股市见顶后10个月美股企稳,当前美股自2021年12月见顶后10个月A股企稳;(3)当年美国在全球贯彻独立宽松货币政策,当前中国在全球实施独立中性偏宽松货币政策已经1年。类似于90年代的市场分化可能重现,A股或在全球衰退中走出独立行情。
从相对估值来看,2022Q3-Q4 股债比价接近2019年初的位置,显示股票相对债券具有较高性价比。
二、量化视角下的行业比较与展望
2.1
宏观因子跟踪体系
我们的宏观因子跟踪体系综合选择了多维度的宏观因子,包括:反映房地产开发进度的房地产开发投资累计同比,反映工业企业利润的PPI和工业增加值,反映国内物价情况的CPI和生猪均价,反映美国物价指数的CRB指数,反映国内经济增长情况的名义GDP和实际GDP,反映国内货币发行情况的M1,M2和社融增速,反映国内债券市场流动性的10年期国债收益率,信用利差,期限利差,反映美国债券市场流动性的10年期美债收益率,反映A股市场估值水平的EP(除金融市盈率倒数),DP(上证红利指数股息率),反映A股市场活跃度的上证指数波动率。
我们模型构建的方法采用逐步回归法,对每个中信一级行业(除综合金融)构建对应模型:
按照预测值选前3行业组合相对行业平均,2018年1月到2022年11月累计超额147%,年化超额20%。
2.2
行业基本面跟踪体系
此前已经完成了包括煤炭、钢铁、有色金属、农林牧渔、建材、化工、家电等行业的中观择时研究,其对应的择时指标和多空收益概览如下表。
2.3
财务指标跟踪体系
财务因子对应行业基本面信息的实际值。
根据最新可得的实际财务数据,我们梳理了涵盖偿债能力、成长能力、收益质量、现金流量、盈利能力、营运能力、资本结构等七个维度,总计49个财务指标。
由于多数财务指标的逻辑对金融地产相关行业适用性较低,针对中信一级行业构建财务因子(包括下文的分析师预期指标)时,不包含银行、非银行金融、房地产、综合金融四个行业。
总体来看,对财务指标因子的测试表明,就行业之间的横向比较和优选而言,较为有效的财务指标类别包括盈利能力和成长能力类的环比增量因子,以及成长能力类的原始因子;即盈利和成长能力相关指标及其边际变化对行业的选择有重要参考意义。
复合财务因子
构造复合财务因子时,对于相关性较高的因子(指标相似、构建方式相似),仅保留表现较优的组合。
对不同的构造方式设计不同的权重赋予方式,由此构造复合财务因子。
从下图来看,复合财务因子整体呈较好的单调性,2007年8月以来,第一组组合年化超额收益率最高,为7.16%,夏普比率达0.326,最大回撤相对更小;第五组表现最差,严格的单调性在第三四组之间被打破,二者的表现在历史大部分时间中非常接近。
2.4
分析师预期跟踪体系
我们对未来的ROE,计算行业预期ROE的上调比例/环比变化因子,选择取值前4的行业构造多头策略,各因子的多头组合表现如下表。预期调整类的ROE因子的表现明显好于行业预期ROE数值因子,其中各有一个因子的年化超额收益率超过5%,夏普比率接近0.3。
2.5
基金经理跟踪体系
我们基于基金仓位估算结果构造行业轮动模型,我们将30个中信一级行业分类人为降维至10个板块进行分析。
我们使用估算板块仓位构造动量策略。策略相对十个板块平均持有,从2011年至今年化超额收益率8.39%。今年以来相对板块基准超额收益-0.51%。
三、选股策略——机构化时代下的alpha争夺
3.1
2022年指数增强产品收益及选股因子表现分析
截至2022年11月30日,存续的指数增强ETF产品(仅计算A类)共201只,总计1615.43亿元,其中业绩基准为沪深300、中证500和中证1000的指数增强产品各54只,56只和19只。
相较于去年末,今年以来沪深300和中证500指增产品规模均有所下滑,而中证1000指增产品规模快速上升。
从不同指增优秀管理人来看,万家基金2022年指增产品业绩优秀,三只宽基指数增强产品均为同业业绩前列,三只指增产品基金经理均为乔亮。
3.1.2 2022年指数增强产品收益分析
在各类事件扰动之下,从整体因子表现来看,过去两年强势的基本面类因子在去年发生了明显的风格反转,高成长类因子从去年底开始失效,低估值类因子表现逐步增强。在过去一年,整体因子变现分化明显。市值类因子表现依旧稳定,盈利,价值等因子表现较好,贝塔因子表现一般且波动较大。受疫情的扰动,整体市场发生了三次比较明显的风格切换,分别是3月,6月以及11月,导致整体因子的波动加剧。未来随着各类事件边际影响减弱,市场的风格切换将逐渐缓和,多因子也将迎来稳定发展的时期。
市值因子
市值因子在过去一年表现突出,因子的IC达到-0.095,ICIR达到2.32。因子在过去一年大部分时间均表现为小市值占优,在今年5,6月份发生了风格反转。目前又逐渐拐头向上,未来能否持续还需进一步观测。
从因子分组收益率来看,最小组的收益较为稳定,在过去一年市场对冲后的收益为24%。最大组的收益为-17%。
非线性市值因子
非线性市值因子在过去一年表现较为稳健,因子IC为0.071,ICIR为3.32。与市值因子类似,非线性市值因子也在今年5,6月发生了明显的风格反转。目前处于稳定的正向区间,建议持续关注此因子。
从因子分组收益率来看,最小组的收益较为稳定,在过去一年市场对冲后的收益为16%,最大组的收益为-11%。
贝塔因子
贝塔因子在过去一年波动较大,因子IC为-0.058,ICIR为0.79。贝塔因子与市场表现息息相关,在过去一年市场的大幅波动导致此因子表现较为一般,长期来看,贝塔因子没有明显的超额收益。
从因子分组收益率来看,因子收益没有明显的单调性。最大组过去一年市场对冲收益为-15%,最小组收益为4%。
成长因子
在经历的过去几年高成长的突出表现之后,从去年年底开始低成长因子逐渐占优,过去一年成长因子IC为-0.052,ICIR为1.76。除6月份成长有过短暂的反转之外,其他时间低成长因子的表现均好于高成长因子,目前成长因子依旧处于负向区间。
从因子分组收益率来看,最小组在过去一年市场对冲后的收益为10%,最大组的收益为-12%。
盈利因子
盈利因子在过去一年表现较好,因子IC为0.086,ICIR为1.74。整体IC较高,但是波动相对较大,目前盈利因子依旧处于正向极值区间。
从因子分组收益率来看,最大组在过去一年市场对冲后的收益为15%,最小组的收益为-17%。
3.2
中信建投中证500指数增强策略跟踪表现
我们构建的中信建投中证500指数增强策略从2011年1月1日到2022年12月11日累计绝对收益1090%,相对中证500累计超额849%,年化超额20.6%,其中2022年在市场风格轮动较为频繁的背景下,取得绝对收益-6.4%,超额收益11.24%,表现较为优异。
3.3
光伏行业因子选股
鉴于行业优秀的alpha和beta属性,我们构建行业指数增强策略。策略的思路如下,在每个月末,观察过去一年之内6个维度内表现最好的一个因子,按照因子打分将剔除次新股后的成份股进行排序,选择排名前10%的股票构建等权组合。
策略绝对收益达到了648%,年化收益率为57.69%。相对光伏设备指数超额313.52%,alpha为18.71%。夏普比率为1.27。整体表现非常突出。
3.4
分析师因子系列的再前瞻——调研
我们构建的机构调研事件选股策略从2016年1月到2022年7月31日,40天持有期组合累计收益259%,累计超额281%,年化超额中证500 22.5%,月度胜率63%,IR 0.70。40天持有期组合在2021年市场复杂的风格轮动下表现优异,绝对收益83%,超额收益59%。
3.5
DEEPLOB模型
Level-1和Level-2是交易所对基本行情和增强行情的一种形象化的表述,Level-2行情(增强行情)相较于Level-1(基础行情)揭示了更丰富的信息。其中,Level-1行情主要包括当日的高开低收价、前收价、最新价、当日累计成交数量和金额、以及实时的买卖五个价位的申报价和数量。而Level-2在Level-1五档盘口的基础上还提供了每个档位上的申报笔数。而两者最大的差异在于,level-1中仅有分时数据,而Level-2数据则包括了逐笔数据,因此Level-2数据具有还原出市场的全部实时状态的强大能力。
3.5.1限价订单簿(LOB)重构
逐笔订单簿记录了订单簿的变动事件,是一类信息流的概念。对于经典的深度学习模型而言,结构化的数据更容易处理,因此需要将原始信息流数据还原成具有固定格式的结构化数据。
3.5.2 模型介绍
DeepLOB的结构可以分为三部分,首先第一部分是一个三层的CNN结构,用于捕捉特征的空间结构,提取高维特征。原始的DeepLOB输入为40个特征因子,经过3层网络之后,将40个特征维度压缩到了一个高维特征。
DeepLOB第二部分是三个并联的CNN网络,与经典的Inception网络结构非常类似,加入1*1的卷积核能够有效提高网络的非线性表达能力。
经过前两部分网络之后,得到的中间结果是一维的时间序列特征,对于时间序列而言,使用LSTM网络能够得到较好的结果。最终经过一个全连接层得到预测结果。
3.5.3 模型结果
首先,将模型应用于训练时的股票在样本外的预测,在连续N次触发信号之后进行交易。平均每次交易的平均收益率与参数N的关系如下图所示。
与股票类似,同样选取样本内平均换手率最高的10只可转债,在样本外,可转债的单次交易的平均收益率如下图所示:
3.6
AlphaZero因子挖掘框架
对于人工智能在因子挖掘中的应用,目前主要还是停留在遗传规模的方法基础上。近几年机器学习发展迅速,以AutoML为代表的特征工程以及模型搭建也早以在工业界实现了广泛应用。本文我们尝试将Google Brain团队提出的AutoML-Zero模型应用与因子挖掘领域,结合实际情况对模型做了相应的修改,构建了AlphaZero框架。
AlphaZero主要是对因子的可解释性,因子挖掘的效率,以及因子的多样性上做了相应的优化,最终的框架不仅能够应用于批量因子的生成,也能够应用于现有因子的改进。
算子及因子
与AutoML-Zero类似,我们将基础数据分为三类;
标量s:常数2,5,10,20,240(仅用于分钟数据)
向量v:中证全指日频涨跌幅,振幅,换手率,上涨股票占比
矩阵m:股票日频最高价,最低价,开盘价,收盘价,成交量;分钟频率最高价,最低价,开盘价,收盘价,成交量
为了使得合成的因子具有一定的可解释性,每类数据都标有相应的量纲(高开低收量纲为元,成交量量纲为手,其他无量纲),在后续计算中,只有特定的量纲之间能够进行合法运算。
所有算子分为三类,分别是元素运算符,时间序列运算符以及横截面运算符。在算子的构建上,尽量选择基础算子,通过个体在搜索空间内的不断进化,构建出最终适应度较高的种群。
在矩阵数据中,存在不同频率的数据,需要首先通过时间序列算子将分钟频率的数据降频的日频,然后进一步进行运算。
因子挖掘结果
对于种群而言,我们更关注整个种群的统计值,下图展示了进化轮数与种群个体的平均IC以及最大个体IC的关系,可以看出,随着轮数增大,种群的平均IC会不断增加,而IC最大的个体变异导致的IC增加存在一定的几率发生,因此会出现几轮不变的情况。
种群的平均IC会出现定期下滑的情况,正式由于我们的灾难算法删除了部分相似个体导致的结果,但是很快种群的IC会得到恢复。
Alpha1
因子的定义为: ts_max((ts_min(interval(volume, sum, 9:30, 10:00)/VOLUME, 2)+ts_corr(high, volume, 240)), 5)
因子是开盘后半小时成交量占比的两日最小值与日内的最高价与成交量的相关性求和之后取五日最大值得到的因子,很明显,此因子是由原始开盘后半小时成交量占比因子与最高价成交量相关性两个因子的基因进化得到的合成因子。
因子的IC均值为-0.0367,IR为7.33,因子胜率为68.21%。
从因子的分组收益率可以看出,多头组自19年起,累计收益103%,空头组的累计收益为-7%,多空年化收益22.51%,多头组的年化收益为21.39%。
四、体系化整合及应用
4.1
六维度行业轮动策略及历史表现
根据自上而下,结合宏观、量化基本面、财务因子、分析师预期、机构偏好、量价技术和资金流等维度,我们构建了六维度综合行业配置模型,并自2022年2月开始对外跟踪。
自2008年至初2022年11月30日,模型年化收益率为14.80%,相对行业等权组合的年化超额收益率为11.54%,除2008年以外,其余年度均获得正超额收益。
2022年以来(截至11月30日),六维度行业轮动模型累计收益率为-7.10%,相对行业等权超额收益率为7.57%。自2月对外跟踪以来,模型累计收益率4.81%,相对行业等权超额收益11.47%。
4.2
六维度行业轮动主动权益基金FOF策略
具体应用上,主要思想是将基金组合在各个推荐行业的暴露尽量控制相等,同时使得期望Alpha最大,同样地,为了避免部分行业主动权益基金暴露不够,基金池选择主动权益基金和指数型股票基金对组合权重规划求解。
主动权益FOF策略2016年至今年化收益23.64%,超额年化14.31%,信息比1.34。今年以来绝对收益-13.38%,相对主动权益基金累计超额收益3.86%。(截止2022年11月30日)。
4.3
六维度行业轮动被动指数基金FOF策略
被动指数基金FOF基金池选择成立18个月以上的被动指数型股票基金,其余计算方法和主动权益基金FOF类似,仅在部分暴露参数上进行调整。
被动指数基金组合2016年至今年化收益18.67%,超额年化13.97%,信息比1.35。今年以来绝对收益-11.83%,相对股票指数基金超额收益7.57%。(截止2022年11月30日)。
证券研究报告名称:《2023年投资策略报告:用量化体系应对市场不确定性》
对外发布时间:2022年12月15日
报告发布机构:中信建投证券股份有限公司
本报告分析师:丁鲁明 执业证书编号:S1440515020001
段潇儒 执业证书编号:S1440520070005
研 究 助 理 : 王 超
刘一凡
郭纯一
免责声明:
本公众订阅号(微信号:中信建投金融工程研究)为丁鲁明金融工程研究团队(现供职于中信建投证券研究发展部)设立的,关于金融工程研究的唯一订阅号;团队负责人丁鲁明具备分析师证券投资咨询(分析师)执业资格,资格证书编号为:S1440515020001。
本公众订阅号所载内容仅面向专业机构投资者,任何不符合前述条件的订阅者,敬请订阅前自行评估接收订阅内容的适当性。订阅本公众订阅号不构成任何合同或承诺的基础,本公司不因任何订阅或接收本公众订阅号内容的行为而将订阅人视为本公司的客户。
本公众订阅号不是中信建投证券研究报告的发布平台,所载内容均来自于中信建投证券研究发展部已正式发布的研究报告或对报告进行的跟踪与解读,订阅者若使用所载资料,有可能会因缺乏对完整报告的了解而对其中关键假设、评级、目标价等内容产生误解。提请订阅者参阅本公司已发布的完整证券研究报告,仔细阅读其所附各项声明、信息披露事项及风险提示,关注相关的分析、预测能够成立的关键假设条件,关注投资评级和证券目标价格的预测时间周期,并准确理解投资评级的含义。
本公司对本帐号所载资料的准确性、可靠性、时效性及完整性不作任何明示或暗示的保证。本帐号资料、意见等仅代表来源证券研究报告发布当日的判断,相关研究观点可依据本公司后续发布的证券研究报告在不发布通知的情形下作出更改。本公司的销售人员、交易人员以及其他专业人士可能会依据不同假设和标准、采用不同的分析方法而口头或书面发表与本帐号资料意见不一致的市场评论和/或观点。
本帐号内容并非投资决策服务,在任何情形下都不构成对接收本帐号内容受众的任何投资建议。订阅者应当充分了解各类投资风险,根据自身情况自主做出投资决策并自行承担投资风险。订阅者根据本帐号内容做出的任何决策与本公司或相关作者无关。
本帐号内容仅为本公司所有。未经本公司许可,任何机构和/或个人不得以任何形式转发、翻版、复制和发布相关内容,且不得对其进行任何有悖原意的引用、删节和修改。除本公司书面许可外,一切转载行为均属侵权。版权所有,违者必究。
本篇文章来源于微信公众号: 鲁明量化全视角