以大小单为核心,构建年化收益20%+的行业轮动组合 | 开源金工
开源证券金融工程首席分析师 魏建榕
摘要
从选股到行业轮动:自下而上的聚合
对于大小单资金流的研究而言,之前我们着重在选股层面,构建了市场上认可度较高的一系列因子,如超大单关注度、大小单残差、散户羊群效应等。对于选股因子聚合至行业层面的方法,主要有两个思考的维度:1、何种方式加权;2、因子用原始值还是分域赋值。对此,我们尝试了5种方案但是整体效果一般,所以后续我们直接从行业本身出发构建行业轮动因子。
对于超大单而言,我们发现原始主动超大单强度2022年之后波动加剧,且出现走平的趋势,因子逐渐失效。针对这一现象,我们采取两种方式进行修正:1、考虑近期强弱趋势;2、考虑资金流的极端与温和。改进后的因子RankICIR从原始0.95提升至1.16,近两年波动和回撤较大的问题一定程度上得到了解决。
对于小单而言,我们主要改进了行业羊群效应因子,主要也分为两步:1、将小单净流入改成非主动小单净流入;2、考虑行业羊群效应的变动,改进后RankICIR-0.86提升至-1.03。
将改进后的主动超大单强度和羊群效应等权合成效果优异,月频调仓下效果最好,RankIC为9.28%,RankICIR为1.62,其逻辑可以归纳为:超大单本期强度较高且不位于高位,散户羊群效应较低且无大幅增加。
对于大单强度而言,我们发现不同行业之间量级存在天然的差别,导致横向比较失真,因子效果较差。因此,针对于大单,我们从行业时序构建事件性因子,发现极端突破具备一定的行业轮动能力,周频调仓效果最优。除此之外,北向券商净流入同样具备这一规律,将二者融合后行业轮动效果较为优异。
除了资金流之外,我们综合考虑了动量、基本面、拥挤度几大维度。在动量维度,我们主要从“极端切割”这一思路出发,构建了极端情绪动量因子,相较于传统动量因子而言,近两年的表现依旧较好。在财务维度,我们抓住了超预期景气模型和困境反转模型显著的轮动周期,相较于只使用单一的景气模型而言,二者轮动后的效果显著提升。在拥挤度维度,我们主要讨论了两种衡量方式:1、以成交额表征的交易热度;2、以赚钱效应表征的盈利水平,其中后者对组合收益提升较为显著。
最终,我们以资金流因子为主体,其余维度进行负向剔除,构建了行业轮动策略,周频调仓下选取5个行业,扣费后组合年化收益21.8%,效果优异。
除此之外,行业轮动模型在指增上也能带来增量。以中证1000指增为例,相较于只使用资金流选股因子,结合行业后多空信息比率从1.55提升至1.98。
点击文末阅读原文,提取码:kyjg
报告发布日期:2024-1-28
在第一部分,我们简单回顾了大小单资金流相关的选股因子,并采取自下而上聚合的方式构建行业轮动因子。
在第二部分,我们直接从行业层面出发,改进了行业主动超大单强度和行业羊群效应因子,二者等权合成后效果非常优异,RankIC为9.28%,RankICIR为1.62。对于大单强度而言,我们发现不同行业之间量级存在天然的差别,导致横向比较失真,因子效果较差。因此,针对于大单,我们从行业时序构建事件性因子,并且和基于北向资金构建的事件性因子合成后,效果提升较为明显。
在第三部分,我们从动量、财务、拥挤度维度出发,构建特色负向剔除因子。在动量维度,我们主要从“极端切割”这一思路出发,构建了极端情绪动量因子,相较于传统动量因子而言,近两年的表现依旧较好。在财务维度,我们发现超预期景气模型和困境反转模型存在较为显著的轮动周期:经济上行时超预期景气因子较好,经济下行时困境反转因子较好,相较于只使用单一的景气模型而言,二者轮动后的效果显著提升。在拥挤度维度,我们主要讨论了两种衡量方式:1、以成交额表征的交易热度;2、以赚钱效应表征的盈利水平,其中后者对组合收益提升较为显著。
在第四部分,我们以资金流因子为主体,其余维度进行负向剔除,构建了行业轮动策略,周频调仓下选取5个行业,扣费后年化21.84%,效果非常优异。
在第五部分,我们将目前已成体系的资金流选股因子和行业轮动因子进行综合,进行了指数增强的尝试。以中证1000指增为例,相较于只使用资金流选股因子,结合行业后多空信息比率从1.55提升至1.98。
01
从选股到行业轮动:自下而上的聚合
对于大小单资金流的研究而言,之前我们在选股上有一系列特色研究,具体列示为表1所示。从表1可以看出,每个单因子的RankICIR皆在3以上的水平,效果较为优异。
进一步地,我们尝试将选股因子聚合至行业层面,观察行业轮动的效果。对于聚合方法,主要有两个思考的维度:1、何种方式加权;2、因子用原始值还是分域赋值。具体地,我们采取如下5种方法:
(1)因子值均值;(2)因子值市值加权;(3)按照因子值分域:从高至低排序,若处于1/3以上标注为1,若处于后2/3标注为-1,其余则标注为0,最后取均值;(4)同(3)进行因子值分域,之后按照市值加权;(5)选取因子值较高的20%,统计分布在不同行业的股票数占各自行业总股票数的比例。
如上几种做法对应的行业轮动因子RankICIR如表2所示。我们可以发现:自下而上聚合的做法效果并不好,其中因子使用超大单关注度效应、方法使用第五种效果最好,但RankICIR也只有0.81。所以后续我们直接从行业层面出发构建行业轮动因子。(注:本文测试为一级行业对应的结果,后文不再重复说明)
02
从行业层面出发构建有效因子
2.1、 资金流强度:改进主动超大单强度RankICIR为1.16
首先,我们测试了四类全部及主动资金流强度的行业轮动效果。具体做法为:(1)针对于单个行业,每月底回看过去20天,计算该行业的累计净流入;(2)由于不同行业净流入存在量级的差别,在定义资金流强度时需进行标准化,方式上我们尝试了市值、成交额、买+卖、净流入绝对值四种。这些因子月频调仓下的RankICIR如表3所示。
从表3我们可以发现,超大单和大单呈现正向预测作用,且由于“超大单+大单+中单+小单=0”,中单和小单呈现负向预测作用。从因子效果而言,利用主动超大单净流入,并市值标准化后的强度效果较好,后文简称原始主动超大单强度。进一步地,我们对其进行5分组回测,如图1所示。
从图1我们可以发现:原始主动超大单强度的多空对冲波动较大,且经常会出现较大的回撤,尤其是在2022年之后波动加剧、出现走平的趋势,因子逐渐失效。后续我们采取两种方式进行修正:1、考虑近期强弱趋势;2、考虑资金流的极端与温和。
1、考虑近期强弱趋势
对于强弱趋势K的界定而言,我们采取的方法为:首先,对原始主动超大单强度取rank值,接着取其过去2个月均值和过去12个月均值的比值。针对于原始主动超大单强度5分组的多头和空头,我们使用K进行分域,统计不同域的年化收益,具体如图2所示。
从图中我们可以发现:无论是多头还是空头,K值相对较低的一组收益表现更好,尤其是近两年,该现象尤其显著。所以这里我们衍生出的改进思路为:在原始主动超大单强度排序的基础上乘以1/K。比值K中的长短回看窗口参数对因子RankICIR影响敏感性分析如图3所示,其中2和12为较合适的参数选择。
2、考虑资金流的极端与温和
进一步地,我们发现资金流是否极端对因子效果也存在一定的影响。对于是否极端,我们的定义方式为:回看过去120天计算均值和标准差,观察净流入是否突破均值上下0.5倍标准差。接着,我们分别计算了极端及温和主动超大单强度,二者在全区间和近两年的RankICIR如图4所示。
从图4中我们可以发现:从近两年看,温和净流入对于因子的效果存在一定拖累;从全区间来看,相较于使用全部净流入,只使用极端净流入计算的主动超大单强度RankICIR并无明显区别,所以后续我们只使用极端净流入计算因子。对于是否极端的定义,我们做了相关参数敏感性分析,因子RankICIR结果如图5所示,其中 120和0.5为较合适的参数选择。
在原始主动超大单强度的基础上,考虑了是否处于高位和资金流的极端与否之后,改进的效果非常明显,RankICIR从原始0.95提升至1.16。除此之外,5分组多空对冲波动明显减小,收益波动比从原始0.74提升至1.03,尤其是近两年波动和回撤较大的问题一定程度上得到了解决。
2.2、 资金流相关系数:改进行业羊群效应RankICIR为-1.03
对于资金流之间的相关系数分析而言,我们在《新型因子:资金流动力学与散户羊群效应》中有过详细的分析,其中行业上的羊群效应和个股上的羊群效应规律并不一致。对于个股而言,
对于原始行业羊群效应的改进思路同样也是两条:1、在计算原始行业羊群效应因子时,我们使用的是全部小单净流入,但是我们在《大小单资金流alpha探究2.0:变量精筛与高频测算》详细分析过,主动小单和非主动小单近年来的性质发生了较大的变化,其中非主动小单往往更能代表散户,所以我们将小单净流入改成非主动小单净流入;2、除此之外,我们发现行业羊群效应的变动同样也是较为显著的行业轮动因子,RankICIR为-0.88,所以我们会进行结合。
结合以上两点的改进,我们得到了改进行业羊群效应因子,其5分组多空如图10所示,RankICIR从-0.86提升至-1.03,近两年的失效和回撤得到一定程度的解决。
2.3、 行业超大单和小单综合资金流因子
我们将上述的改进行业主动超大单强度和改进行业羊群效应进行合成,月频调仓下的效果如图11所示。该因子的RankIC为9.28%,RankICIR为1.62,效果非常优异。该综合因子逻辑可以解释为:超大单本期强度较高且不位于高位,散户羊群效应较低且无大幅增加。
2.4、 行业主动超大单和羊群效应升频后效果
近年来,行业轮动和风格轮动的速度逐渐加快。对于行业轮动因子而言,大家倾向于提高调仓频率来减弱因子失效的问题。在此部分,我们尝试将行业主动超大单强度和行业羊群效应因子升高调仓频率,尝试周频调仓下的效果。
1、行业主动超大单强度
首先,对于主动超大单强度而言,在月频调仓下我们采取两条改进思路:1、考虑近期是否处于高位;2、考虑资金流的极端与温和。在升高调仓频率后,由于能够更快的把握资金短期的动向,所以第一条改进思路在升频后用处不大。除此之外,在提高调仓频率后,计算资金流强度的时间窗口适当缩短可以提升因子效果,其对因子RankICIR影响的参数敏感性分析如图12所示。我们以回看过去10天为例,RankICIR为1.40,5分组的回测如图13,相较于月频调仓效果有一定程度的提升。
2、行业羊群效应因子
对于行业羊群效应因子周频调仓而言,回看天数对因子RankICIR影响的参数敏感性分析如图14所示。从图中我们可以看出,相较于月频的羊群效应因子,RankICIR并无提升。这里以回看过去15天为例,RankICIR仅为-0.73,5分组的回测如图15。
进一步地,我们尝试将周度的行业主动大单强度和行业羊群效应因子进行合成,其5分组回测如图16所示,合成后的因子RankICIR为1.44,其相较于月频的1.62反而有所下降。对于行业轮动模型而言,升频后往往对应的是交易费用的提升和操作难度的加大,若因子RankICIR无显著提升,维持低频的做法相对较为合理,所以对于二者结合我们推荐月频的做法。
03
大单资金流:极端突破存在行业轮动能力
在以上的分析中,我们主要针对超大单、小单进行了改进,本章节我们集中在大单在行业轮动上的应用。在本文第一部分,我们已经测试了大单强度的行业轮动能力,但效果非常一般,其原因我们认为主要为大单强度在不同行业的量级有显著差别。
以交通运输和银行行业为例,二者的大单强度时序数值如图17所示,可以发现数值明显有偏。进一步地,我们分别测试了超大单强度和大单强度的滞后一期自相关系数,如图18所示,可以发现大单强度滞后一期自相关系数明显高于超大单强度。因此对于大单而言,我们倾向于采取时序研究方式,探究其能否进一步带来行业轮动相关的增量。
3.1、 事件效应构成行业轮动因子:大单极端突破效应
对于大单的时序信息挖掘而言,我们在《知情交易者背后的择时信息》中已经分析了其极端突破具备一定指数择时的能力。顺着这个思路,我们进一步探究其是否具备行业轮动能力。具体做法为:对于单个行业每日净流入,回看过去120天计算均值和标准差,观察是否突破均值上下0.5倍标准差,若当日发生极端向上突破计为1,发生极端向下突破计为-1,其余情况计为0,在调仓日回看过去N个交易日并求和,若大于0为多头,小于0为空头。
在上述的做法中,涉及到了调仓频率和回看天数的问题。首先,以回看过去10天为例,月频调仓下对冲收益波动比为0.44,双周频为1.19,周频为1.50,可以发现周频调仓下的多空表现明显高于其余频率调仓,所以这里以周频为主进行展开。其次,回看天数对多空年化收益影响的参数敏感性分析如图19所示,我们选取回看天数N=10为最终的参数。
3.2、 事件效应构成行业轮动因子:与其他资金流的联合
除了大小单资金流,市场中较为常见的,且能够进行日频跟踪的为北向资金和两融资金等。这里我们也采取同样的方法做了尝试,其中较为有效的为外资券商的净流入数据,回看天数对多空年化收益影响的参数敏感性分析如图21所示。相较于大单而言,最优回看天数会更长一些,这里我们选取N=20为最后的参数。
3.3、 大单和外资券商联合的综合效果分析
最终我们将大单极端突破和外资券商极端突破进行结合,其中大单和外资券商都有3种信号,我们将其结合可以得到如下9种收益表现,可以发现二者如果都看多,则效果相对较好,而二者若都看空效果是最差的,有一定联合增强效果。
3.4、 资金流的综合应用方案
至此,大小单资金流在行业轮动上的应用已经做了详细的分析,最后我们将上述的因子进行合成,得到最终资金流因子。合成方法为:(1)将改进行业主动超大单和改进行业羊群效应等权合成IND_EX_S;(2)将大单异常突破因子和外资券商异常突破因子等权合成IND_L_N;(3)由于IND_EX_S为月频,而IND_L_N为周频,首先我们将IND_EX_S升频,空缺值前向填充,接着将其与IND_L_N等权合成,构成最终周频的资金流综合因子。其5分组回测如图24所示,表现较为优异,RankICIR为2.03,该因子也是本文最后优选行业的核心主体因子。
04
其他维度的综合考虑:动量和财务维度
对于资金流因子而言,其表现已经较为优异。进一步地,我们尝试从其他维度出发,提升资金流因子的行业轮动效果。本部分我们主要考虑了动量维度和财务维度,并定义了一些特色因子,这些因子近两年的表现依旧较为优异。
4.1、 动量维度:“极端切割”为核心改进点
1、传统动量:周频调仓效果较好
由于近年来行业轮动的速度在加快,低频调仓的动量策略失效较为严重,调仓频率的提高对于动量因子效果的提升有明显的帮助。这里,我们以5日、10日、20日、60日和120日为例,测试了周频、双周频和月频调仓的RankICIR,具体如表4所示。从表中我们不难发现,在如上的几种回看天数下,周度调仓的效果都是最好,其中回看天数为10天效果最优。该因子RankICIR可以达到1.00,但是其5分组多空对冲近两年也出现逐渐走平的迹象。这里我们尝试从“极端切割”思路对其改进。
2、“极端切割”思路一:行业自身极端的信息
我们在《日内极端收益前后的反转特性与因子构建》中从股票层面出发,发现日内最极端的收益往往alpha属性较为强烈。在这里,我们将这一想法衍生至行业层面,定义了行业极端情绪动量。具体做法为:对于单个行业,求过去N天正收益最大的日度收益,过去N天负收益最大的日度收益绝对值,最后取二者的比值。其中回看天数N对因子RankICIR影响的参数敏感性分析如图26所示。这里我们取N=10,5分组的效果如图27所示,相较于传统动量,近两年的表现也依旧较为优异。
除此之外,我们发现对于行业极端情绪动量因子而言,叠加趋势系数后因子效果可以得到进一步改善,具体做法为:对行业极端情绪动量取Rank值,并取其过去M个月均值和过去N个月均值的比值K,用K乘以行业极端情绪动量的Rank值为最终的因子。M和N对因子RankICIR影响的参数敏感性分析如图28所示。我们选取M=10,N=20为最终参数。
3、“极端切割”思路二:市场整体极端的信息
在传统动量的做法中,我们倾向于回看过去N天,把这N天的收益都用上。但是由于信息在时间轴的分布可能是不均匀的,导致并不是每天的涨跌都能对最终的因子有所贡献。
这里我们尝试探究市场在大涨大跌时的行业收益的动量属性,具体做法为:(1)在每个交易日计算行业收益的均值,并回看过去120天,计算均值和标准差,判定在120天均值上下M倍标准差之外的为市场极端日;(2)在调仓日,回看过去N个交易日,计算这N个交易日中市场极端日行业动量排序值均值,为市场极端情绪动量。
其中,判断极端的条件中的标准差倍数,以及回看天数对最终因子月频调仓的RankICIR敏感性分析如图29所示。最终我们选取2倍标准差,回看过去5天均值,月频调仓下的5分组对冲如图30所示。(注:这里尝试了不同频率的调仓效果,月频较优)
虽然市场极端情绪动量因子效果较为优异,但是其存在缺失值,非空的样本数只占到全区间的25%,并不能作为单独因子进行使用。最终我们将行业极端情绪动量和市场极端情绪动量进行合成,为综合极端动量因子。该因子RankICIR为0.88,其5分组的净值如图31所示。
4.2、 基本面维度:困境反转和超预期景气的有效轮动
对于基本面维度而言,我们在《业绩超预期Plus2.0:基于预期调整的修正》中构建了行业超预期景气因子,RankICIR为0.60,在《价值Plus组合构建与多策略融合实践》中构建了困境反转因子,RankICIR为1.00。二者在行业轮动上的5分组效果如下所示。
对于以上的两个基本面模型而言,其存在天然的互补性。为了更加直观的观察这一现象,我们使用两个模型的月度RankIC相减,如下图所示,该相对强弱有着明显的轮动周期:经济上行时超预期景气因子较好,经济下行时困境反转因子较好。
进一步地,我们利用二者的轮动周期,尝试了如下的行业尾部剔除方案:使用RankIC累计差值进行强弱判断,若RankIC累计差值在6个月均线之上,则剔除困境反转后6个行业;若RankIC累计差值在6个月之下,则剔除超预期景气后6个行业。从图35可以发现结合二者轮动的尾部剔除方案,相对于行业等权基准有较为稳定的超额。
05
资金流的综合行业轮动方案
本章节我们以综合资金流因子为主体,其余维度为负向剔除维度,构建行业轮动策略。
5.1、 动量和财务维度剔除的敏感性分析
对于作为负向剔除维度的动量和财务,我们对剔除数量做了相关敏感性测试。以动量维度为例,具体做法如下:使用动量剔除排名较低的N个行业后,利用资金流综合因子选取5个行业,观察这5个行业的年化收益。具体的敏感性分析结果如下图所示。从图中我们可以看出,动量维度的剔除较为有效,财务维度的剔除效果不佳。
5.2、 拥挤度加入的影响探讨
除此之外,以上讨论的模型,不论是核心因子综合资金流,还是补充因子动量而言,其往往都是偏右侧的,这里我们加入了拥挤度指标作为最后一道的筛选。
对于拥挤的衡量同样存在两种方式:1、以成交额表征的交易热度;2、以赚钱效应表征的盈利水平。对于交易热度而言,我们回看过去120天计算每天成交额的分位数,并取过去10天均值。对于盈利水平而言,每天计算月度涨跌幅较高的20%的个股,统计分布在不同行业的股票数占各自行业总股票数的比例作为赚钱效应,并回看过去120天赚钱效应计算每天的分位数,取过去10天均值。
不论是交易热度还是盈利水平,最终都是历史分位数的形式。最终多少分位数以上算是较为拥挤呢?我们进行了参数敏感性测试。以交易热度为例,具体做法如下:剔除动量排序较低的10个行业,且交易热度在λ分位以上的行业后,利用资金流综合因子选取5个行业,观察这5个行业的年化收益。具体的敏感性分析结果如下图所示。从图中我们可以看出,盈利水平对于组合的改进有一定帮助。
结合以上的讨论,我们的方案为:剔除动量排序较低的10个行业,且盈利水平在90%分位以上的行业后,利用资金流综合因子选取5个行业,周频调仓,手续费双边千一,最后组合净值如图40,绩效如表5所示。
对于行业的选取数量而言,我们这里也做了相关敏感性分析,不同行业的年化收益和收益波动比如图41所示。从图中我们可以发现随着选择行业数量的增多,整体绩效较为单调,其中在选取行业个数为2~5的情况下,年化收益和收益波动比较为稳定,所以我们最终方案是每期推荐5个行业。
06
其他重要讨论
至此,对于大小单资金流而言,我们在选股上和行业轮动上都有相对应的解决方案,具体列示如表6所示。
其中对于选股因子而言,合成后RankIC为6.71%,RankICIR为4.74,其5分组多空对冲曲线如下所示,效果较为优异。
进一步地,我们结合行业和个股因子进行了1000指数增强的尝试,因为指数增强往往以月频为主,这里我们进行了月频的尝试,因而在行业轮动上我们只采用了超大单和小单的结合,大单并没有进行使用。
对于1000指增的参数设置,这里我们规定:(1)手续费双边千三,组合换手率约束上限为50%;(2)个股权重超额基准上下限不超过1%,且个股限制卖空;(3)风格因子暴露上下限制不超过2%;(4)若不加行业轮动模型,则行业上下限的暴露都为0,若加行业轮动模型,则上下限的暴露参数设置如表7所示。
从图44我们可以发现:行业轮动对于指增存在一定增量,考虑行业之后多空信息比率从1.55提升至1.98。
07
风险提示
模型基于历史数据测算,市场未来可能发生重大改变。
相关报告(可点击链接):
end
团队介绍
开源证券金融工程团队,致力于提供「原创、深度、讲逻辑、可验证」的量化研究。团队负责人:魏建榕,开源证券研究所副所长、金融工程首席分析师、金融产品研究中心负责人,复旦大学理论物理学博士,浙江大学金融硕士校外导师、复旦大学金融专硕校外导师。专注量化投资研究10余年,在实证行为金融学、市场微观结构等研究领域取得了多项原创性成果,在国际学术期刊发表论文7篇。系列代表研报《开源量化评论》、《市场微观结构》、《开源基金研究》,在业内有强烈反响。2016年获新财富最佳分析师第6名、金牛奖分析师第5名、水晶球分析师第6名、第一财经最佳分析师第5名;2022年获金牛奖最佳金融工程分析师、Wind最佳路演分析师。团队成员:魏建榕/张翔/傅开波/高鹏/苏俊豪/胡亮勇/王志豪/盛少成/苏良/何申昊/陈威/蒋韬。
本篇文章来源于微信公众号: 建榕量化研究