【国信金工】基金经理持仓收益与投资业绩
报 告 摘 要
为了能够更好地预测基金的未来收益,我们对基金业绩进行了拆解,将基金收益拆分为了基金经理持仓收益、基金经理交易收益以及打新收益三部分。通过自2017年以来的统计结果我们发现,主动股票型基金的收益主要由基金持仓部分所贡献。
经过进一步的验证,我们发现基金未来持仓收益与基金未来收益之间具有很强的相关性,未来持仓收益高的基金往往有更好的业绩表现。因此,对基金未来业绩的预测很大程度上可以通过对基金未来持仓收益的预测来体现。
对于主动股票型基金而言,基金的持仓即为基金持有的股票组合,而基金持仓收益即为持仓中股票组合的收益。因此,我们借鉴了量化选股方面的研究成果,发掘对于股票未来收益具有一定预测性的因子,再将这些因子映射到基金的持仓中,以此来对基金未来的持仓收益进行预测。
在经过了市值和行业中性化之后,我们从基本面、技术面以及资金面等多个维度选择出了对股票未来业绩以及基金未来业绩同时具有显著预测效果的因子,构造了基金持仓收益因子。
三、基金持仓收益因子
我们将对于基金持仓收益具有显著预测性的因子合成了基金持仓收益因子。基金持仓收益因子对于基金业绩具有较为显著的预测能力,季度RankIC均值为9.94%,ICIR为1.06,多空年化收益为9.25%。
同时,基金持仓收益因子具有较强的特质性。我们从持仓收益因子与常见选基因子相关性、剥离常见选基因子后的增量信息以及将持仓收益因子加入到常见选基因子后是否能提升复合因子对基金收益的预测能力等维度进行了讨论与测试。测试结果表明,持仓收益因子能够对基金未来业绩进行有效预测,同时可提供常见选基因子之外的增量信息;在加入基金持仓收益因子后,新的复合选基因子具有更强的收益预测效果。
四、引入基金持仓收益因子的FOF组合构建
在引入持仓收益因子后,新的复合选基因子的IC均值为14.39%,ICIR为2.05,相对于原始综合选基因子预测能力显著提升。接着我们通过组合优化的方法构建基于板块控制的FOF组合,组合自2013年以来基本每年都在主动股基中排名前1/3,历年平均排名分位点23.51%。组合费后年化收益为22.75%,相对主动股基年化超额11.16%,年化跟踪误差4.89%,超额收益最大回撤6.13%,信息比2.28,超额收益回撤比1.82。从2013年以来的41个季度中,有36个季度均战胜了主动股基中位数,季度胜率高达87.8%,达到了稳定战胜主动股基的效果。
在之前的FOF系列专题报告中,我们构建了隐形交易能力、业绩洞察能力、基金规模、机构关注度、基金员工信心以及波段交易能力等不同的选基因子,将这些因子等权合成综合选基因子,对基金的未来业绩具有较好的预测效果。本篇报告我们将尝试从基金收益拆解的视角出发,对基金的收益来源进行探究,进而探索对基金未来收益进行预测的新方法。
一
从基金收益的来源谈起
为了能够更好地预测基金的未来收益,我们首先对基金业绩进行了拆解,以此了解基金收益的来源,我们将基金收益拆分为了基金经理持仓收益、基金经理交易收益以及打新收益三部分。
其中,基金经理持仓收益是指:通过买入并持有基金经理季报时点披露持仓中个股组合获得的收益。基金经理交易收益是指:基金经理通过调仓换股或者波段交易所产生的收益。打新收益是指:基金经理通过参与申购新股获得的收益,我们使用2020年12月9日发布的《公募打新全解析—历史、建模与实践》中计算基金打新收益的方法对基金的打新收益进行测算。通过观察不同来源的收益对基金整体收益的贡献,我们可以抓住影响基金收益的主要因素,以帮助我们更好地预测基金的未来收益。
我们以某主动股票型基金A为例,并以中证800指数为业绩基准,将基金A自2017年以来每个月的超额收益在持仓、交易、打新这三个维度进行拆解,分为持仓收益、交易收益以及打新收益三部分。其中,持仓收益的计算方式为基金最近季报时点披露的(补全)持仓组合在未来一个月的收益减去基准收益;打新收益为基金当月通过打新获取的收益部分,交易收益为基金超额收益减去持仓收益与打新收益后的剩余部分。后文的其它基金拆解分析也与此类似,我们均以中证800指数为业绩基准,对基金的超额收益进行持仓、交易、打新三部分的拆解。
基金A的收益拆解结果如图2所示。从总样本期来看,基金A的累计收益为100.03%,其中累计持仓收益、交易收益以及打新收益分别为99.83%、-15.11%以及15.31%,分别贡献了累计总收益的76.65%、-11.6%以及11.75%。整体来看,基金A的收益主要由基金持仓部分所贡献。
接下来,我们也同样对全体主动股票型基金(包括普通股票型、偏股混合型以及灵活配置型基金,且过去连续4个报告期股票仓位均大于70%)的收益来源进行了考察,将其自2017年一季度以来的收益进行了拆解,结果如图3所示。
自2017年以来,主动股票型基金的累计收益为69.12%,其中持仓收益、交易收益以及打新收益分别为49.24%、0.77%以及19.11%,分别贡献了累计收益的71.24%、1.11%以及27.65%。
考虑到不同业绩排名基金的收益来源可能存在一定差异,我们在每个季度对过去一年所有主动股票型基金的业绩进行排名,对其中排名在前20%和后20%基金的收益进行了拆解,结果如图4所示。
自2017年以来,业绩排名前20%基金的累计收益为116.43%,其中累计持仓收益、交易收益以及打新收益分别为82.59%、16.1%以及17.74%,分别贡献了累计收益的70.94%、13.83%和15.24%;业绩排名后20%基金的累计收益为42.08%,其中持仓收益、交易收益以及打新收益分别为29.7%、-5.75%以及18.13%,分别贡献了累计收益的55.43%、-10.73%和33.84%。其中值得注意的是,绩优基金的交易收益为正,说明绩优基金具备一定的调仓换股能力。但即便如此,持仓收益依然是基金收益的大部分来源。
此外,我们从换手率的角度出发,在每个季度将换手率最高的20%的基金定义为高换手率基金,将换手率最低的20%的基金定义为低换手率基金,并分别对这两类基金的收益来源进行了拆解,结果如图5所示。
可以看到,自2017年以来,高换手率基金的累计收益为54.69%,其中持仓收益、交易收益以及打新收益分别为42.32%、-3.54%以及15.91%,分别贡献了累计收益的68.52%、-5.73%以及25.75%;低换手率基金的累计收益为86.52%,其中持仓收益、交易收益以及打新收益分别为51.66%、13.45%以及21.41%,分别贡献了累计收益的59.71%、15.54%以及24.75%。可见,不论对于高换手率基金还是低换手率基金,持仓收益对基金整体收益均有较大的贡献。
打新收益在不同年份的贡献不一,得益于科创板和创业板注册制的推出,2019年和2020年打新收益贡献明显,但2021年之后打新收益贡献快速下滑。长期综合来看,主动股票型基金的收益主要由基金持仓部分所贡献。
因此,基金的持仓收益很大程度反映了基金的未来收益。进而我们猜想,假如能够预测基金季报时点持仓股票的收益,是否就能基本预测出基金的未来收益?为验证这一想法,我们进一步测试了基金持仓收益与基金实际收益的相关性。
具体来说,在每个月月底,我们使用基金的持仓(如果最新披露半年报或者年报则使用全部持仓,如果为季报则使用还原后持仓,详细的做法可以参考国信金工团队于2021年12月16日发布的专题报告《公募基金持仓还原及其实践应用》)计算基金持有的股票组合在下一季度的收益(假设我们预知未来一个季度的个股收益),我们将上述方法计算出的未来持仓收益作为因子值,与基金在下一季度的真实收益进行对比,测试结果如图6和图7所示。
从统计结果可以看到,基金持仓收益与实际收益的RankIC均值为35.02%,RankICIR为4.37,多空年化收益为29.62%,预测效果十分显著。
我们由此得出结论,基金未来持仓收益与基金未来收益之间具有很强的相关性,未来持仓收益高的基金往往有更好的业绩表现。因此,对基金未来业绩的预测很大程度上可以通过对基金未来持仓收益的预测来体现。
二
从选股到选基
对于主动股票型基金而言,基金持仓收益即为持仓中股票组合的收益。因此,我们自然联想到,能否通过预测股票未来收益,来对基金的未来持仓收益进行预测?这样一来,我们对基金持仓收益的预测很大程度就转化成了对股票未来收益的预测。
国信金工团队在多因子选股领域深耕多年,我们借鉴了团队在多因子选股维度的研究成果,发掘对于股票未来收益具有一定预测性的因子,再将这些因子映射到基金的持仓中,以此来对基金的持仓收益进行预测。
具体来说,如图8所示,基金的持仓收益等于其持有所有股票的未来收益乘以相应持仓权重之和;而每只股票的未来收益又等于收益模型下各收益预测因子得分乘以对应权重之和。公式表达如下:
由此,通过穿透基金的持仓,我们对基金的持仓收益预测问题就转化成了对季报时点持仓股票组合的收益预测问题。
接下来,我们的研究主要分为两大部分,第一部分是对选股因子进行测试:在对因子中性化处理后,我们希望选择出在股票层面具有显著预测性的因子;第二部分是对选基因子进行测试:在对基金持仓进行还原后,我们结合基金的持仓结构,将预测效果较好的选股因子构造成选基因子并进行测试,选择选基效果依然较好的因子作为我们最终的持仓收益因子。
1
选股因子的中性化处理
在我们使用因子进行选股时,我们通常希望选股因子能够独立地预测股票在未来的收益,不受到市场风格、所处行业涨跌等外界因素的扰动,使得选出的股票不具有与因子本身无关的风格暴露。因此,在判断某一个因子是否有解释能力的时候,我们首先需要排除其它变量,比如行业、市值的干扰。对因子这样的处理称为因子中性化。
考虑到个股因子可能会受到市场大小盘、行业等风格的影响,我们在计算选股因子时,对股票的市值和行业做了中性化处理。经过市值和行业中性化后的因子计算方式如下:
2
选股因子测试
在经过了市值和行业中性化之后,我们从基本面、技术面以及资金面等多个维度选取了在股票市场中有效的Alpha因子,并对因子在选股层面的预测性做出了测试,选择出了对股票未来业绩预测效果较好的因子,将它们作为后续构建选基因子的备选。具体来说,我们要求因子与股票未来收益的RankIC>2%,RankICIR>1且多空年化收益率>5%。
我们以特异度指标和股息率这两个因子为例,进一步说明我们在股票层面选择有效因子的过程。
股息率因子(DividendRateTTM)的计算公式为:股息率=股息(TTM)/总市值。
由图9和图10可知,在经过市值以及行业中性化之后,特异度因子月度RankIC均值为7.28%,年化RankICIR为2.99,多空年化收益为22.85%;股息率因子的月度RankIC均值为4.18%,年化ICIR为2.69,多空年化收益为11.15%。特异度因子和股息率因子因子均在个股层面的预测表现较好,因此我们将它们作为后续构建选基因子的备选。
3
结合基金持仓构建选基因子
在选择了在股票层面预测效果较好的因子之后,我们接下来将选股因子与基金持仓相结合,测试因子在选基层面的预测效果。
我们首先对基金的完整持仓进行了还原,主要还原步骤如图11所示。概括来说,我们遵循“已知持仓>管理人持仓>回归拟合”的优先原则,综合基金持仓和基金收益率两个维度的数据,分三个阶段还原基金全部持仓:
1、基金的已知持仓是能够直接获得的基金持仓,可信度最高;已知持仓包括基金季报中的前十大重仓股和上市公司前十大(流通)股东数据,当基金出现在上市公司前十大(流通)股东内时可以反向推算出基金持有该股票的权重。
2、基金管理人持仓来自于同基金经理在其他基金中的同期持仓和本基金的上期持仓,可参考性相对较高;管理人持仓是指该基金经理同期管理的其他基金中的已知持仓(简称“基金经理同期持仓”)和本基金的上期持仓。在使用基金经理同期持仓时,我们仅参考已知持仓重合度高的基金持仓。在使用本基金的上期持仓时,我们剔除了新股和尾部权重较小的股票。
3、如果用已知持仓和管理人持仓不能充分还原基金全部持仓,则参考基金收益信息,使用回归拟合的方法,在备选股票池中选出对基金收益拟合度最高的股票作为基金持仓。备选股票池基于基金经理近期调研股票记录、同基金公司股基持仓、公募股基持仓、中证800、港股通成份股进行构建。为了避免填入过多股票,使用“断尾”的方法限制股票放入数量上限,然后基于OLS 回归筛选出对基金收益拟合度最高的股票放入基金的持仓。
详细的做法可以参考国信金工团队于2021年12月16日发布的专题报告《公募基金持仓还原及其实践应用》。
在还原了基金的完整持仓后,我们对基金持股权重进行了调整,具体流程如下:
1、剔除了基金经理没有重点关注或因打新、公司停牌等原因而被动持有的权重很小的股票,将基金持股权重在0.5%以下的个股剔除;
2、对于持仓权重大于0.5%的股票,我们采用分级靠档的调整方式,将持仓权重后向上取整(如某基金持有A股票的权重为2.46%,则向上取整为3%),以保证加权权重的稳健性;
3、不少基金公司对基金经理重仓的个股有严格的考评制度,对于持仓权重5%以上的个股,要求有调研及深度的研究覆盖,所以我们认为基金经理持仓5%以上权重的股票都是其重视的股票,不再对5%以上的权重加以区分,这里我们将基金经理持有个股的权重做截尾处理,即持仓5%以上的权重统一按照5%来计算;
4、将以上步骤得到的调整权重在截面做归一化处理,得到的新权重。
图12以一个案例展示了基金持股权重的调整流程。
通过分级靠档和权重上限截尾的调整,我们弱化了股票权重变化对收益预测模型的影响。最终,我们将经调整后的权重作为持仓股票在加权时的新权重,对选股因子取加权平均,即得到相应的选基因子。
在结合了基金持仓将选股因子构造为选基因子后,我们希望该因子在选基层面仍具有较好的预测效果。具体来说,我们要求选基因子与基金未来一个季度收益的RankIC>2%,RankICIR>0.3,且多空年化收益率>2%。
我们仍以特异度指标和股息率这两个因子为例,进一步说明我们在选基层面测试因子有效性的过程。
从图14的特异度因子十档分组测试结果可以看到,特异度因子不但在选股层面表现较好,同时对于预测基金持仓收益也有较好的表现。在全样本期,特异度因子在选基层面的季度RankIC均值为7.26%,年化RankICIR为2.63,多空年化收益率为6.64%,是较为有效的选基因子。然而,如图15所示,股息率因子对基金持仓收益的预测效果却并不显著,月度RankIC均值为2.54%,年化ICIR值为0.21,且十档分组效果呈现出较为混乱的排列。
为什么在选股层面有效的因子,转化到选基层面可能会失效?我们尝试对股息率因子在选基层面预测效果不佳的原因进行分析。我们首先对全市场股票每年的股息率进行了统计,按照个股流通市值对全市场股票的股息率进行加权,得到全市场股票的加权平均股息率;接着我们以全体主动股基对每只股票的持仓市值作为权重,计算了主动股票型基金持有股票在每年的平均股息率,记为主动股基股息率。
我们知道主动基金经理整体的配置风格偏向于成长,如图16所示,自2010年以来,主动股基配置股票的股息率每年都低于全部A股的整体股息率,大多数的基金经理在选股时并不会把股息率作为重要指标,由于主动股基长期在股息风格上暴露较低,因此股息率因子在选基层面的效果不佳。
可见,并非所有对选股有效的因子都同样适用于选基。因此,在结合基金持仓构造因子时,还需要对因子在基金选择层面的表现加以考察和筛选。
三
基金持仓收益因子
1
基金持仓收益因子的构成
根据上一章节介绍的选基金因子筛选流程,结合国信金工团队自建的选股因子库,我们最终从在股票市场中有效的Alpha因子中选出了在基金层面依然有较好预测效果的因子,作为持仓收益因子大类下的二级因子。因子主要包括如表1所示:
我们统计了上述因子在多空年化收益、RankIC均值、RankICIR、RankIC胜率以及十档分组这几个维度的表现,以展示这些因子分别在预测股票收益和预测基金持仓收益方面的能力。从表2可以看到,每个因子对股票未来业绩以及基金未来持仓收益都有显著的预测作用。
接下来,我们统计了上述因子间的相关性。其中,下表中右上三角展示了选基因子在截面取值的相关性,左下三角展示了选基因子IC序列的相关性。
从表3可以看到,各个因子之间取值相关系数较低,长期相关系数绝大多数都在0.3以下。
最后,我们将选择出来的所有可以用来预测基金持仓收益的因子等权合成为持仓收益因子。图17展示的是基金持仓收益因子的IC测试结果,基金持仓收益因子的季度RankIC均值为9.94%,ICIR为1.06。图18展示的是基金持仓收益因子的十组分档测试,持仓收益因子第十组(因子得分最高一组)年化超额收益为5.45%,多空年化收益为9.25%。可见,持仓收益因子能够显著对基金未来持仓收益产生较强预测能力。
由前面的测试结果可以看到,持仓收益因子对基金业绩有较强的预测作用,持仓收益因子得分越高的基金统计上看未来的业绩表现会更好。那么,基金的持仓收益因子与常见选基因子的相关性如何?是否对于常见选基因子具有增量信息?下面我们将就此进行讨论与检验。
2
基金持仓收益因子相对传统选基因子的增量
在国信金工团队往期的FOF系列专题中,我们介绍过7大类选基因子,包括隐形交易能力因子、收益类因子、机构关注度因子、基金规模因子、员工信心因子、业绩洞察能力因子和波段交易能力因子(因子的具体构建方式详见附录1)。关于选基因子,我们在此做简单的回顾,具体内容可参考国信金工团队前期的FOF系列专题报告。
在2020年8月26日发布的报告《基金经理业绩粉饰与隐形交易能力》中构造了隐形交易能力因子和业绩粉饰因子。
在2020年10月28日发布的报告《基金经理前瞻能力与基金业绩》中介绍了衡量基金经理提前布局超预期股票能力的因子—业绩前瞻能力因子,此外还介绍了收益类选基因子(TM-FF超额收益因子、夏普率因子)、机构关注度因子、基金规模因子和员工信心因子。
在2021年4月21日发布的报告《基金经理调研能力与投资业绩》从基金经理调研次数和基金经理调研质量两个维度介绍了基金经理调研能力因子。
在2021年8月18日发布的报告《基金经理洞察能力与投资业绩—基金经理前瞻能力的改进》中对前瞻能力因子做了更为全面和细致的改进,构造了收益预测效果更好的基金经理洞察能力因子。
在2022年6月20日发布的报告《基金经理波段交易能力与投资业绩》中我们从区间累计买卖交易明细数据中捕获了基金经理的波段交易能力。
对于基金持仓收益因子的特质,我们将从持仓收益因子与常见选基因子相关性、剥离常见选基因子后持仓收益因子表现、将持仓收益因子加入到常见选基因子后是否能提升复合因子对基金收益的预测能力这几个维度进行讨论与测试。
表4所展示的是持仓收益因子与7大类因子之间的相关性,其中右上三角展示了选基因子截面取值的相关性,左下三角展示了选基因子RankIC序列的相关性。
可以看到,各选基因子截面取值的长期相关性较低,均不超过0.3。其中,持仓收益因子与其余选基因子的相关性普遍较低,与收益类因子、隐形交易能力因子、基金规模因子、机构关注度因子、员工信心因子以及波段交易能力因子的相关性均在0.1以下,与业绩洞察能力因子取值的相关性最高,但也只有0.3。由此我们可以看到,持仓收益因子与常见选基因子均有较低的相关性,具有相对独立的信息增量。
接下来,我们将之前研究提出的收益类因子、机构关注度因子、基金规模因子、隐形交易能力因子、员工信心因子、业绩洞察能力因子和波段交易能力因子这七大类等权合成为一类因子,作为原始的综合选基因子,对原始综合选基因子与基金持仓收益因子进行相关性检验。
经测试,原始综合选基因子与基金持仓收益因子的长期相关性较低,仅为0.12;且2015年以来整体相关性更低一些,为0.08。因此可以看出,两大类因子彼此较为独立,各自拥有与彼此异质的独特信息。如果长期来看相关性较低的两类因子各自对基金未来收益均具有一定预测性的话,那么这两类因子进行线性合成将产生较大增益。
接着,我们尝试将持仓收益因子对常见选基因子进行剥离,即对常见选基因子进行中性化,考察中性化后因子的表现。
从图21可看出,中性化后的持仓收益因子仍然维持了不错的单调性,第十组(持仓收益因子得分最高组)的年化超额收益为2.01%。
从上面的测试可以看出,尽管一些常见选基因子已经具有不错的收益预测能力,但持仓收益因子在剥离了这些因子的影响后,依然具有一定的收益预测效果。从这个角度来看,持仓收益因子相对于常见选基金因子而言也具备一定的增量信息。
因此,我们将持仓收益因子加入到常见选基因子中,考察先前的7类因子等权复合后形成的原始选基因子与加入了持仓收益因子后的新综合选基因子的表现。
图22所展示的是加入持仓收益因子后新的综合选基因子与原始综合选基因子的RankIC走势对比,可见加入了持仓收益因子后的新综合选基因子的累计RankIC可以较为稳定地超过原始综合选基因子。原始复合选基因子的RankIC均值为12.88%,ICIR 为2.23;在加入持仓收益因子后,新的复合选基因子的IC均值为14.39%,ICIR为2.05。新的选基因子拥有更高的IC均值。
从图23所展示的十组分档测试对比可以看到,原始综合选基因子第十组(因子得分最高一组)年化超额收益为5.57%,多空年化收益为10.26%;在加入持仓收益因子后,新的综合选基因子第十组年化超额收益为6.78%,多空年化收益为12.37%。加入持仓收益因子后新的复合选基因子具有更强的多头组合、更高的多空年化收益。
至此我们完成了持仓收益因子的构建与测试,测试结果表明,持仓收益因子能够对基金未来业绩进行有效预测,同时可提供常见选基因子之外的增量信息,加入持仓收益因子后,新的复合选基因子具有更强的收益预测效果。
四
引入基金持仓收益因子的FOF组合构建
1
稳定战胜主动股基中位数并非易事
表5展示了连续3年每年业绩排名前N%分位点的主动股基占比,从滚动3年的时间维度来看,可以连续3年战胜主动股基中位数的基金平均占比为13.55%,连续3年每年都排名处于前30%的主动股基占比仅为3.30%,而仅有0.11%的主动股基可以做到连续3年每年都排名处于前10%。可见,能够做到连续稳定战胜主动股基中位数的基金并非易事。
此外,我们统计了自2010年至2022年任意两年间业绩排名在20%分位点的主动股基相对同期主动股基业绩中位数的年化超额收益,结果如表6所示。
可以看到,当投资的时间周期越长时,排名前20%基金所需实现的年化超额收益越小。例如,在2018年至2022年的5年间,主动股基排名前20%分位点的基金与中位数相差为5.04%,但在2013年至2022年的10年周期下下,主动股基排名前20%分位点的基金与中位数的年化超额仅有2.95%。也就是说,如果基金管理人能获得相对同业平均3%以上的年化超额,其自2013年以来的10年期业绩将在同业中排到前20%。
因此,当拉长周期来看,主动股基之间的收益差异趋于收窄,主动股基的长期业绩回报可谓是“积跬步以至千里”。如果能够构建每年稳定战胜主动股基中位数的组合,那么其长期业绩排名将处于相对靠前的位置,从中短期持有体验来看,投资者的持有体验能够得以提升,这将是极具性价比的投资模式。
由此可见,构建出能够长期在各种市场环境下都能稳定战胜主动股基中位数的FOF组合具有非常重要的意义。为此,我们尝试使用包含基金持仓收益因子和其它常见选基因子的多因子选基模型来构建出相应的FOF组合,以达到长期稳定战胜主动股基指数的目的。
2
基于板块控制的FOF组合构建
如果我们简单地通过综合选基因子来选择得分最高的基金来构建基金组合,容易导致基金组合在单一行业或者板块上的过多暴露,造成组合在行业或板块上相对主动股基出现较大的偏离,从而导致组合表现出现较大波动。因此,我们尝试从控制FOF组合的行业配置入手,希望尽可能降低组合相对于主动股基的最大回撤。图24分别展示了证监会、中信以及Wind行业分类口径下2022年年报的主动股基平均行业配置比例。
从图24中,可以看到,不同分类下的行业结构差别也非常大。其中,证监会行业分类下主动股基的平均行业配置呈现出较强的集中性,有超过70%的权重集中在制造业中。而中信行业分类体现出较强的分散性,最大的一级行业配置权重不超过15%。而在Wind行业分类下,主动股基的平均行业配置则相对均衡一些,并且板块的划分颗粒度适中。
具体而言,证监会一级行业分类将股票分成了制造业、金融业、房地产业等19个行业,但主动股基平均在制造业的股票数量占比超过70%,其成分股涉及到建材、钢铁、汽车、机械、有色金属,食品饮料、家电、轻工制造、纺织服装、医药等不同跨度很大的行业。很显然,制造业过于粗糙的划分不能帮助我们区分一些公募重仓但表现差异有很大的行业。
中信一行业分类将股票分成30个行业,所呈现出来的结果要比证监会行业细化很多,主动股基配置最多的电力设备及新能源行业占比12.82%,权重在5%以上的行业有7个,权重在3%以上的行业有11个,有19个行业的配置权重低于3%。大多数的行业主动股基配置权重都不高,在后期做组合优化行业控制时,很容易出现大量小权重行业被忽略的情况。
Wind一级行业分类类似于国际流行的GICS行业分类,将股票划分成了能源、材料、工业、日常消费、医疗保健等11个行业,主动股基配置最多的信息技术占比21.52%,有5个行业的配置权重在10%以上,行业分布相对均匀,既不失颗粒度,也不会因划分过细而引入噪音。
综合上述考虑,我们选择了行业分布相对均匀而不失颗粒度的Wind一级行业分类来作为我们对组合中股票行业的度量口径。
接下来,我们以主动股基的行业配置为约束,最大化FOF组合的得分,希望构造出稳健战胜主动股基的FOF组合。我们采用组合优化的方法构建基于板块控制的FOF组合,此组合优化问题是一个目标函数为最大化组合的基金收益预测模型得分,同时限定约束条件的线性规划问题。优化模型的公式如下:
其中,我们设定FOF组合相对于主动股基平均行业配置的相对最大偏离为10%,组合中个基权重上限为5%。
基于板块控制的FOF组合构建流程如下:
调仓时点:1、4、7、10月末之后的第一个交易日。
选基样本空间:在调仓时点时满足如下条件:
1.成立或者转型超过15个月的普通股票型、偏股混合型以及灵活配置型基金且过去连续4个报告期股票仓位均大于70%;
2.只保留初始基金(若存在C/E/H/O等类别,只保留A类基金);
3.基金合计规模大于2亿;
4.剔除调仓时点暂停申购或暂停大额申购的样本。
板块配置约束:以主动股基的平均行业配置权重为中枢,板块配置权重最大偏离幅度为10%。
个基权重约束:0%-5%。
组合构建方式:满足约束条件的前提下最大化FOF组合的加权得分。
交易费率:申购费率为1%%,赎回费率为0.5%。
申赎限制:在调仓时点,暂停申购或暂停大额申购的基金不调入,暂停赎回的基金则保留不调出。
业绩基准:主动股基中位数指数。
图25为基于板块控制的FOF组合净值表现回测结果。可以看到,经板块控制的FOF组合表现稳定,2013年以来相对主动股基中位数指数的超额收益稳定攀升。
表7展示了基于板块控制的FOF组合的分年度绩效统计,组合在大部分年份的业绩能排进主动股基的前30%。年化超额收益为11.16%,年化跟踪误差为4.89%,超额收益的信息比为2.28,相对收益回撤比为1.82,平均排名分位点为23.51%。可以看到,基于板块控制的FOF组合收益稳健,能够稳定战胜主动股基表现的中位数水平。
接下来我们在更细化的时间段来考察,我们考察了基于板块控制的FOF组合在季度维度上的表现,如图26所示。在2013年以来的41个季度中,组合只有5个季度小幅跑输了主动股基中位数,季度胜率高达87.8%。
综上所述,组合在各种市场环境下均能大概率稳定战胜主动股基。
最后,我们对基于板块控制的FOF组合每期持仓的加权平均规模以及组合每期持仓基金数量做了统计,分别如图27以及图28所示。其中,图27展示的是FOF组合每期持仓的加权平均规模情况:在全样本期,组合的平均规模为11.41亿元,2012年-2015年FOF组合的加权平均规模较高,为15.49亿元,近两年来FOF组合的平均规模有逐渐提升的趋势,加权平均规模为11.96亿元。
图28所展示的是FOF组合每期持仓基金数量情况。在全样本期,组合的平均持仓基金数量为20.4只基金,回溯期间共出现过两次FOF组合持基数量达到最大值,为22只基金,分别在2019年11月初以及2021年8月初调仓时点,绝大部分时间,组合的持基数量为20只基金。
至此,我们通过基金收益拆解、将选股因子结合基金持仓构造选基因子、将持仓收益因子融入常见选基因子等步骤,用组合优化的方式完成了基于板块控制的FOF组合的构建,组合自2013年以来基本每年排名均处于主动股基的前1/3,历年平均排名分位点23.4%,组合费后年化收益为22.7%,相对主动股基年化超额11.15%,年化跟踪误差4.89%,超额收益最大回撤6.13%,信息比2.28,收益回撤比1.82。从2013年以来的41个季度中,有36个季度均战胜了主动股基中位数,季度胜率高达87.8%,达到了稳定战胜主动股基的效果。
五
总结
基金收益拆解
我们自2017年一季度以来,将每个季度主动股票型基金的收益进行拆解为持仓收益,交易收益以及打新收益。发现在基金的收益贡献中,持仓收益占比最高。因此如果能够对基金经理的持仓收益进行预测,则有可能提升对于基金未来收益的预测显著性。
如何预测基金经理持仓收益
对于主动股票型基金而言,想要预测基金经理的持仓收益,就等价于预测基金经理持仓中个股的收益。因此,我们可以借鉴量化选股方面的研究成果,发掘对于股票未来收益具有一定预测性的因子,将这些因子映射到基金的持仓中,以此来对基金未来的持仓收益进行预测。
首先,为更好的预测基金经理持仓收益,需要因子在选股层面具有显著的预测性,因子与股票未来一个月的月度RankIC>2%,RankICIR>1且多空年化收益率>5%。
同时,还需要将选股因子通过结合基金持仓构造为选基因子后,该因子仍然具有一定的选基效果,选基因子与基金未来一个季度的RankIC>2%,RankICIR>0.2且多空年化收益率>2%。
通过层层筛选后,可以将符合条件的因子加入到现有因子中,先将基金持仓收益因子进行等权合并,再将基金持仓收益因子与原始综合选基因子进行合成,从而形成综合选基因子。在加入基金持仓收益因子后,综合选基因子的预测性具有整体的提升。
最终,将新的综合选基因子应用到组合优化中,通过控制组合与主动股基池中基金持仓平均配置的板块偏离,来构建组合,使得组合的表现有较为显著的提升。
在加入持仓收益因子后,综合选基因子的历史RankIC序列,RankIC均值为14.39%,年化RankICIR为2.05。且综合选基金因子对于基金未来业绩的十档分组测试结果,因子得分越高的基金分组,未来一个季度相对等权基准的超额收益越高,非常单调,多空组合年化收益12.37%。
引入基金经理持仓收益因子的FOF组合
组合基本每年的业绩都在主动股基的前1/3。年化超额收益为11.16%,年化跟踪误差为4.89%,超额收益的信息比为2.28,相对收益回撤比为1.82,平均排名分位点为23.51%。
六
附录
1
选基因子简介
TM-FF超额收益:[Fama@2010]使用Fama-French三因子以及Carhart四因子[Carhart@1997](Fama-French三因子加MOM因子)对基金经理的投资能力与运气进行分析,发现基金剔除影响因子之后的超额收益越高,未来的基金业绩越好。[Liao@2017]利用TM模型[Treynor@1966]将二者进行结合,将基金收益率剔除Fama-French三因子以及市场收益率平方项的影响,用回归的截距项来预测基金未来收益,TM-FF回归方程如下:
其中,R_fund表示基金收益率,R_MKT表示市场收益率,使用过去240个交易日的基金日度收益率进行上述回归,取回归后的截距项的α作为因子值。
基金业绩的夏普率:[Sharpe@1966]最早提出可以使用基金业绩的夏普率对基金的表现进行衡量。我们使用基金日度公布的净值数据,计算基金夏普率指标。通常认为过去一段时间基金风险调整后收益更高的基金,未来有更大可能取得更好的投资业绩。我们使用过去240个交易日的基金收益率数据,
其中,𝑓𝑢𝑛𝑑𝑟𝑒𝑡表示基金日度收益率。
基金规模:[Indro@1999]提出基金规模会影响基金业绩表现。[Chen@2004]使用基金超额收益率对基金规模进行回归检验,发现基金的超额收益率与基金规模呈现负相关性,出现这一现象的原因我们认为有两个:一是规模小调仓冲击更小,所谓“船小好调头”;二是规模小的基金在打新收益端的回报比规模大的基金要更高。基金规模在基金的季度报告中可以通过期末基金资产净值直接获取,这里我们取合并规模,即如果一只基金包含A、C等不同类别时,需要加总计算所有类别基金合并后整体的基金资产净值。
机构关注度:[Pan@2015]提出基金机构投资者的持有比例可以预测基金未来的收益率,他们发现,有机构投资者持有的基金相比没有机构投资者持有的基金每年经风险调整的收益率高出0.80%-1.24%。一般认为,机构投资者相比个人投资者具有更加专业成熟的投资眼光,如果一只基金的持有人结构中机构投资者占比较高,说明这只基金受到机构投资者的认可,未来也更有可能获得更好的业绩回报。机构投资者占比可以在基金半年报以及年报中的基金份额持有人信息中获取。需要注意的是,如果一只基金包含A、C等不同类别份额,需要按规模对不同类别份额的机构投资者占比进行加权,以此得到该基金整体的机构投资者占比。
基金员工信心:[Allison@2008]检验了基金管理人持有本基金占比与基金未来收益率之间的关系,发现占比越高的基金未来收益越好。基金管理人的从业人员持有占比越高表明该基金的从业人员对本基金产品的信心越强。实证表明这类基金未来收益相较持有占比低的基金收益更高。该数据可以在基金半年报以及年报中的基金份额持有人信息中获取。需要注意的是,如果一只基金包含A、C等不同类别份额,需要按规模对不同类别份额的机构投资者占比进行加权,以此得到该基金整体的从业人员持有占比。
隐形交易能力:[Kacperczyk@2008]以及[Puckett@2011]提出了基金隐形交易能力的概念,隐形交易能力考察了基金实际业绩与按季报披露持仓组合之间的收益差,实证表明隐形交易能力越强的基金未来业绩越好(详细可参考我们2020年8月26日发布的专题报告《基金业绩粉饰与隐形交易能力》)。本文中我们用基金定期报告期后的三个月内,基金真实收益率相比披露持仓组合收益率的超额信息比来刻画基金经理的隐形交易能力。
业绩洞察能力:旨在定量衡量基金经理提前布局并买入之后一段时间对应股票实现吃好预期的能力。构造时我们使用基金定期报告中持仓公布时点后,披露的所有股票定期公告信息,选取定期报告披露后十天内发布的券商分析师研究报告,计算持仓中收到分析师认可的股票数量以及分析师不认可的股票数量,形成数量差,除以覆盖该股票的机构数,以此来刻画基金经理对上市公司的业绩洞察能力。(详细计算方法可参考我们2021年8月18日发布的专题报告《基金经理洞察能力与投资业绩—基金经理前瞻能力的改进》)。
波段交易能力:使用基金在半年报以及年报中披露的区间累计买卖交易明细数据,来反应基金经理的波段交易操作,就像基金经理的“航迹”,可以使我们将持仓信息“连点成线”,为刻画基金经理的动态交易行为提供了可能。我们可以通过分析区间累计买卖交易明细数据来捕获基金经理的波段交易能力。(详细可参考我们于2022年6月20日发布的专题报告《基金经理波段交易能力与投资业绩》。
2
主动股基p分位数指数
在衡量权益型FOF的业绩时,通常采用偏股混合型基金指数(885001.WI)或中证主动式股票型基金指数(930890.CSI)来作为基准。这类基准通过样本池中基金的收益进行加权,可以很好的反应高仓位运作的主动管理型基金的整体走势。
然而在基金业绩考核时,大家通常还会关注基金在同类产品中的排名分位点,例如基金业绩是否处于同类产品的前50%,某基金连续三年业绩排名同类产品前1/3。这时候光看偏股混合型基金指数就不能更细致的刻画基金业绩究竟处于什么分位点,因此我们构造主动股基金p分位数指数,具体构造方式如下:
在每年年末最后一个交易日,筛选出成立或者转型超过15个月的普通股票型、偏股混合型以及灵活配置型基金,同时满足过去连续四个报告期权益仓位均大于70%的基金为主动股票型基金,作为下一年度计算指数的主动股基池,年初至时点主动股基金p分位数指数收益率idxret(T,p)的计算方式如下:
图28和图29分别展示了主动股基中位数指数、偏股混合型基金指数的净值走势与分年度收益对比,可以看到,长期来看,两者的走势贴合度比较高,分年度的收益也都比较接近。
注:本文选自国信证券于2023年4月18日发布的研究报告《FOF系列专题之七:基金经理持仓收益与投资业绩》。
分析师:张欣慰 S0980520060001
分析师:刘 凯 S0980522040002
风险提示:市场环境变动风险,组合失效风险。
本篇文章来源于微信公众号: 量化藏经阁