刘欣:资金分域定价与基金指数增强
发言实录:
首先,我们来探讨一下这个问题的来源。事实上,这些年来,大家一直在追求基金指数增强的方法。在2017年,我们对此进行了探索。首先需要找到基准。但是由于我们并不了解基金指数的真实持仓情况,因此,我们面临的第一个问题是如何去衡量基准。最早的方法是将每个季度或者半年报中的所有持仓拿出来,进行静态的基准计算。后来,大家又进行了一些改进,比如通过净值变化分析其动态的持仓调整情况。
第二个问题是有了基准之后,如何用多因子等传统方式来增强。然而,这里面存在一个很大的问题,即大约90%以上的基金都采用基本面投资方式,这些基金更倾向于持有基于基本面定价的股票,而这些股票的规律与整个市场不同,因此它们的阿尔法可能也会有所差异。
当时我们进行了这样的尝试:如果按照上述方法进行基金指数增强,超额收益就等于组合减去基金指数。我们可以对这个做一个拆解,组合收益相当于基于基本静态季报持仓的基准,再加上量化的阿尔法。而减去的基金指数相当于基于基金季报持仓的基准,再加上期间持仓风格的变化,比如今年年初基金整体增加了TMT股票的持仓,再加上基于基本面投资的附加阿尔法。将这两者相减就可以得到超额收益的来源,即量化的阿尔法减去基本面的阿尔法,再减去持仓风格的变化。
在不考虑持仓风格变化的情况下,假设我们可以通过一些基金持仓监测手段来克服它,在量化阿尔法减去基本面阿尔法是最大的难题,而且量化的阿尔法恰好作用在基本面投资者所熟知的这些股票上。这引出了下面的问题,即分域定价的现象,不同的因子或方法在不同的股票上的定价作用是完全不一样的。
我们在最近几年最为关注资金分域定价问题,它会在时间和空间上产生影响。在时间上,比如在17到20年,基本面的投资方法非常流行。但在2021年春节之后,量化阿尔法变得非常强劲。这背后都是资金流向的影响。我们刚才提到过一个问题,为什么量化领域普遍认为上证50很难做阿尔法。但现实中确实有一些资金在这一领域可以实现相对较强的阿尔法。
我们想抛开我们现在所认知的一切,回到市场的本源,思考其推导过程。股票的涨跌有很多原因,但涨跌最直接的原因是买入意愿多,股票上涨;卖出意愿多,股票下跌。这是绝对的直接原因,可以通过逻辑来证明。
如何观测资金的行为呢?我认为可以大致分为两个方面来分析。一方面是资金的意愿,另一方面是资金的能力。对于资金的意愿,市场上90%的策略分析都在讨论这个问题,比如基本面分析,比如在策略分析中看好某个行业,这都是在讨论资金的意愿。
然而,我们经常忽视另一个方面,即资金的能力。那什么是资金的能力呢?举个例子来说,假设我是公募基金的基金经理,我特别看好证券行业,那么决定购买多少股票的因素,除了个人的意愿之外,最重要的因素是手头有多少资金。事实上,资金的能力往往也是至关重要的,而且有时候它的影响甚至超过了资金的意愿。资金的能力更多受到宏观经济和监管制度的影响。
对于基本面因素,长期的股价是由估值乘以盈利所决定的。从海外数据来看,估值长期来看在有限范围内波动。随着时间的推移,估值的单位时间变化率较低,因此市场长期体现出一种基本面特征。右侧的图表是美国过去100多年的历史数据,显示长期股价的实际涨幅基本上与企业盈利增速相等。左侧的图表来自一本名为《投资收益百年史》的英文书籍,列举了16个历史超过100年的国家。从长期来看,权益投资的回报是最高的,即扣除通胀的实际回报。但债券投资可能出现负收益,尤其是战败国,它们典型地出现了负收益,主要是由于恶性通货膨胀的影响。
从基本面的角度来理解这个问题。我们可以通过一个简单的图表来表示:对于每个指数,假设我们知道当前季度的报告期盈利率(ROE),那么它的涨幅减去ROE代表了估值的波动。
不同市值区间指数的涨幅贡献因素是不同的。我们对每个指数都绘制了图表,黄色向上的线代表了ROE贡献的累积值,蓝色表示指数的复权收益,灰色线表示估值的波动。典型的例子是沪深300和中证1000。沪深300盈利非常强劲,类似于基金的重仓股,但估值贡献在2007年估值高点之后一直处于波动状态,甚至有下降趋势。而对于中证1000,涨幅大部分来源于估值的波动,包括成分股的切换,每年都要切换一次成分股。所以不同领域的定价特征是完全不同的。
接下来我们来看一下市场资金构成,这是来自上交所官方的统计年鉴数据。个人投资者,也就是我们所说的散户,比例大约为20%左右。一般法人即大股东们交易量较小,交易量占比不到1%。我们普遍认为市场上最活跃的机构资金公募基金,它们在市场中的占比是相对较低的。北上资金近年来有所增加,但总量相对较低。其他机构主要是保险和社保等其他金融机构。我们认为市场上最主要的活跃力量,或者媒体所报道的力量,只占了上交所交易量的10%左右,交易量中个人投资者大约占70%到80%,上交所的数据比基于十大股东来测算更公允,因为很多人无法买到前十大股东。
接下来,我们进行了更高频的统计,即对机构进行统计。这里的数据来源是什么呢?对于公募基金,使用基金业协会的数据,其中私募基金的数据滞后大约两个多月;保险数据可以使用保险业协会的保险使用资金数据;而北上资金的数据是公开透明的,大约滞后一天。
可以发现市场机构的资金变化自2015年以来分为三个阶段。第一个阶段是从2015年到2017年。在这个阶段中,整体特征是公募资金的占比下降,而北上资金则缓慢上升,但占比绝对量相对较低。因此,在这个时间点上,你会发现市场特征是整体的小票非常强势,类似于当前的市场情况。
然后从2017年之后到2021年,整体来看,最大的增量来自于北上资金和公募资金。因此,在那个时期,跑过公募基金的平均表现是比较困难的。
在2021年之后,整体来看,北上资金和公募基金都有缓慢的下滑。其中可能有各种各样的原因,比如资管新规的顺利实施等等,也包括一些地缘因素等等。资金趋向发生了非常明显的变化。这一阶段对于量化投资无论是公募还是私募来说,是相对较好的时机。
接下来,我们把时间范围延长。对许多从事量化投资的人来说,2017年可能是最黑暗的一年,因为从来没有见过大小盘差异如此之大。这样的情况是曾经发生过。图表中蓝色部分表示公募基金加北上资金占流通市值的比例,红色部分则表示绩优股的超额收益,我们使用中证绩优股指数,包含ROE最高的100家公司,可以看作是茅台指数。绩优股超额收益与机构占流通市值的比例完全呈正相关关系。而从2017年到2020年的这段时间,绩优股超额收益迅速上升,背后是机构资金的增加。2002年到2006年阶段,公募基金也是大幅战胜了中证全指。右侧展示了小盘股的超额收益与机构资金的对比,它们呈现相对强烈的反向关系。因此,通常情况下,在市场不太好的年份,量化投资会格外出色。
前面讨论了整体市场,下面讨论局部市场。机构资金在局部市场具有一定的定价能力,特别是右上图表更为明显。阴影部分表示北上资金在医药股中所占比例,蓝色线表示这些医药股相对于医药指数的超额收益,两者的曲线和面积图几乎是重合的。对于北上资金深入介入的这些股票来说,北向资金基本上具备了定价能力,超额收益与资金占比呈直接正向关系。左侧是食品饮料行业的整体趋势,在2017年到2020年的这段时间,它们完全呈同向关系,机械行业也是如此。当然,有人会问计算机行业是否不受北上资金定价的影响,事实上,计算机行业中北上资金深度介入的股票收益和北上资金占比也显示出严格的正相关关系。
为什么分析机构资金比较有代表性呢?因为市场没有所谓的真正的净流入和净流出,流入和流出总是相等的。在零和博弈的情况下,分析机构行为比较有用。通常机构投资者具有较强的一致行动性,因为受到共同培训方式的影响。而个人投资者的交易模式实际上非常复杂多变。
然后我们来谈谈空间上的定价特征。用30个中信一级行业做了几个组合,在每个行业中,分别使用季报公募基金重仓股、北向资金、券商金股、基本面优选股票和量化优选股票做组合。我们假设交易成本为单边千三,然后观察每类投资者在每个行业中的超额收益情况。
我们总结结论是:如果按照30个行业的加权平均来计算,量化优选股票的超额收益更高。但是,如果按照全市场基金持仓市值来加权,比如基金重仓的行业,如食品饮料、电信、医药等,基本面优选的超额收益更高。量化投资在那些缺乏机构关注的行业中具有较强的超额收益。而基本面研究在那些核心重仓行业中表现较强,这是一种稳态下的情况。当然,如果资金净流出的话,基本面的表现也会较差。
我们再用量化语言来描述一下。同类型因子在不同的市场领域中,IC和IR是非常重要的指标。IC通常被理解为截面相关性,即因子的真实能力,而IR被认为是能力乘以宽度。显然,全指的宽度最高,所以我们不能仅仅比较IR,我们需要同时比较IC和IR。无论是IR还是IC,基本上都体现出随着资产越偏向核心资产,越偏向基金重仓持仓领域,量化优势逐渐下降,而在全市场中,量化优势较为明显。
接下来,如何利用这些现象。比如,某类资金对某个局部市场有定价权,或者某段时间定价了某些局部市场。大致有三种做法。第一种是不能判断哪种方式最好,而采取相对均衡的加权方式,例如常见的风险平价思想,即认为风险是中性的,应该尽量均衡地进行配置。第二种方式是可以判断某段时间某种资金占优,据此动态调整策略。第三种方式是可以判断在空间上,在某个行业或板块内,机构或者个人可能占优,做相应的策略配置。
简单谈一下我对第一种思路的探索。我们的思路源于风险平价的理念,即市场部分领域或时间是基于基本面进行定价,另一部分时间和领域是个人投资者进行定价,我们希望实现均衡的配置,类似于桥水基金提出的全天候思想。
我们梳理了一下从2000年到现在每年的明星基金经理或指数的超额收益来源,大致可以归纳为五类。第一类是长期盈利质量,即基于对长期业绩的假设和护城河的假设,比如茅台指数,在过去20年非常出色,2002年到2005年也非常强劲。第二类是成长类,基于对2到3年的中期业绩的判断,持有那些渗透率正在提升的行业,这是典型的基本面思路。这两类是行业研究员刚刚担任基金经理最喜欢的策略,代表就是新消费和新能源,或者现在的计算机行业,这也是类似的思路。第三类是估值切换,即买入股票不仅估值低,而且盈利稳定。像现在市场上券商在推的红利类的策略,本质上也属于这种方式。这种方式市场上有很多人吆喝,但真正采用的人比较少,因为它在牛市中涨幅不大,只是在熊市中抗跌而已,多数固收出身的固收+基金经理比较喜欢这种方式。第四类策略是业绩超预期、分析师推荐等,本质上是在赚取信息扩散的收益。公募基金的基本面团队、量化团队和私募基金都在开发这类策略。理论上,这类策略是全天候适用的,但最大的问题是策略退化速度非常快,因为大家都在竞相追逐这部分利润。最后一类是针对小盘股的统计套利策略,在市场上的5000只股票中,只有1500只是核心持仓,剩下的3500只都属于小盘股。
我们当时考虑的问题是,为什么在过去20年市场呈现出这五类策略的轮动?后来我们的想法是,它恰好对应了一种分类方式。如果将所有股票分为两类,一种是机构定价,一种是非机构定价。非机构定价的股票,无论是大盘股还是小盘股,都适用于统计套利的方式。有人会问是否一定要做小盘股?小盘股与机构非重仓股其实高度正相关,但并不完全一样。例如阿尔法策略在沪深300指数中可能不太适用,但在中证红利指数中就非常适用。因为大家可能不偏好周期股,但周期股的市值并不小。在机构定价的股票中,我们前面讲的成长类和盈利质量类策略,实际上对应DCF模型中不同时期现金流的预期,而低估值策略对应的是风险溢价。因此,我们认为这是一个相对完备的框架。
我们也研究了海外的因子。我们查阅了许多历史资料,并浏览了Barra的网站。当时Barra网站还公开披露数据,现在已经停止了。他们披露了大约几十个国家的风险因子的长期表现。长期来看,我们发现其中一些风险因子具有单向表现。长期只有大约四个因子在所有市场都得到验证,并且都呈现出单向回报。其中一个因子是低估值因子(value),在剔除其他风险因素后,在不同市场中长期都有正向回报。这种趋势在三四十年的时间里,在十几个市场上都得到了规律性的验证,因此很有可能是可延续的。另一个因子是盈利质量,也呈现出一定的延续性。但是,市值因子(size)和成长因子(growth)在各个国家之间方向差异非常大。我认为量化对于成长因子的定义并不是真正的成长,因为量化是基于盈利预测或过去的盈利增长线性外推来判断成长,真正的成长是基于企业业务的增长。量化无法准确描述成长概念,这是我个人的判断。
然后我们将这几类风格进行了绘图,展示了它们的长期轮动情况。我们用红色表示表现好,用绿色表示表现差,每年进行一次评估。我们注意到小盘股的超额收益相对较为连续,具有较强的延续性。而其他风格基本上每2到3年会有变化,成长和低估值之间基本上是竞争关系。
我们当时进行了简单的尝试,试图将这五类策略进行组合。假设每种策略占五分之一的比例。有人问为什么没有人去做这样的组合?我的想法是,第一点,几个因子需要不同的资源,成长和质量因素需要依赖基本面因素而不是量化因素,低估值、小盘套利和业绩刺激可以用量化方法来描述。第二点,需要内心接受市场上存在多种策略,而不是偏好某种策略。第三点,有人可能会说,这就是FOF的事情,只需要购买五种不同类型的基金进行组合。然而事实上,坚持单一策略的基金经理往往面临巨大的压力,特别是在某一种风格连续表现不佳四五年后,所以需要在策略上自己去进行均衡配置相对更好。
然后我们进行了简单的回测。第一个是成长类策略,基于对基本面行业的判断,我们进行了一些简单的量化筛选,数据是完全客观可以回溯的。成长类型策略的超额收益幅度较大,但波动幅度也很大。第二个是盈利质量类策略,在21年之前表现良好。在21年春节出现了大幅下跌,然后又回到了平稳状态,但超额收益幅度肯定下降了。第三个是低估值策略,超额收益基本上像白噪音一样随机,但是绝对收益相对回撤较小,这是为什么市场上许多固定收益基金经理会喜欢低估值策略。第四是小盘股策略,实际上,无论是现在的机器学习还是过去的多因子模型,本质上都是类似的。它在长期超额收益方面非常强劲,但在17到20年间的表现并不好,也是量化领域比较困难的几年。第五是量化所认为的成长策略,实际上我认为它并不是真正的成长,而是基于超预期信息速度的策略。它的超额收益相对稳定,但这些策略失效的速度非常快,需要不断进行迭代更新。
我们当时简单地将这五类策略进行了平均组合。策略超额相对比较稳定,它基本上可以适应不同的市场状态。
我们尝试了判断某种风格、资金定价现象是否会持续。我们采用了一种最简单、最朴素的动量方式,即追随表现好的因子。但实际上,效果在21年之后并不好,样本外的超额收益表现并不好。
我们尝试了采用资金判断的方式,而不是基于价格判断。实际上,这种方法的超额收益相对更稳定。这是一个值得关注的现象。在小盘股内部,在小盘成长和小盘价值之间,也可以进行轮动。
做「开源」的量化研究
to be a quant,to be open-minded.
开源证券金融工程团队 | 魏建榕 张翔 傅开波 高鹏 苏俊豪 胡亮勇 王志豪 盛少成 苏良 何申昊 陈威 蒋韬
end
团队介绍
开源证券金融工程团队,致力于提供「原创、深度、讲逻辑、可验证」的量化研究。团队负责人:魏建榕,开源证券研究所副所长、金融工程首席分析师、金融产品研究中心负责人,复旦大学理论物理学博士,浙江大学金融硕士校外导师、复旦大学金融专硕校外导师。专注量化投资研究10余年,在实证行为金融学、市场微观结构等研究领域取得了多项原创性成果,在国际学术期刊发表论文7篇。系列代表研报《开源量化评论》、《市场微观结构》、《开源基金研究》,在业内有强烈反响。2016年获新财富最佳分析师第6名、金牛奖分析师第5名、水晶球分析师第6名、第一财经最佳分析师第5名;2022年获金牛奖最佳金融工程分析师、Wind最佳路演分析师。团队成员:魏建榕/张翔/傅开波/高鹏/苏俊豪/胡亮勇/王志豪/盛少成/苏良/何申昊/陈威/蒋韬。
本篇文章来源于微信公众号: 建榕量化研究