【华安金工】可比公司法的量化实践:重塑价值因子 ——量化基本面系列报告之九
►主要观点
量化研究中的估值体系尚存缺陷,价值因子亟待改进
主动研究常用绝对估值法和相对估值法进行企业内在价值的评估,面对不同行业、公司时会采用不同的估值模型。然而,量化从业者在处理“价值”类指标时稍显简单粗暴,直接以相对估值乘数作为因子,忽略了相对估值法背后的逻辑假设和意义。另一方面,价值因子虽长期仍能提供正向贡献,但稳定性欠佳。本篇报告中,尝试借鉴可比公司法,基于财务数据寻找目标企业的可比公司,全方位对价值因子进行重构。
定量化寻找可比公司,全方位重构价值因子
从生命周期、公司规模、盈利能力、资产结构和运营效率五个维度定义可比公司,通过余弦相似度计算可比公司间的相似程度。从基准、空间和时间三个维度重塑价值因子:基准类因子直接以可比公司的估值定义标的价值,并构造了个性度加权的价值因子;空间类因子通过计算目标公司和可比公司估值间的距离表征赛道空间大小以及成长溢价;时间类因子通过计算当前估值空间在过去1年中的位置定义目标公司的相对估值性价比。
关联价值因子预测能力显著,相较于原价值因子有明显提升
关联EP因子在全市场内表现十分出色,自2013年1月1日至2023年1月31日,行业市值中性后的关联EP因子Rank IC均值为4.87%,年化ICIR分别为3.49,IC月胜率达85.12%,分十组收益呈现严格单调,且多头和多空组合的超额收益和回撤改善幅度明显。
可比公司框架下的改进方法对于不同类别的价值因子适用性较强,合成后的大类关联价值因子的选股效果有显著提升,相比原价值因子ICIR由2.47提升至3.75,IC月胜率从74.4%提升至86.8%,多空年化收益提升3.3%,且在不同指数域和板块中几乎都有较为明显的改善。
为考察关联价值因子对多因子模型的边际贡献,以沪深300和中证500指数增强为例,将原价值因子替换为关联价值因子提升组合收益和稳定性。其中,中证500增强组合的年化超额收益由17.31%提升至19.04%,且跟踪误差和相对回撤均有明显改善,信息比由2.94提高到3.38,超额收益风险比有显著提升。
本报告基于历史个股数据进行测试,历史回测结果不代表未来收益。未来市场风格可能切换,Alpha因子可能失效,本文内容仅供参考。
01
长久以来,如何对企业进行合理估值是投研人员的核心命题之一。无论是对于机构还是个人投资者,立足于公司的财务数据对企业的内在价值进行评估不仅是重要的研究手段,也是从业者的必备技能。合理的估值有助于理解企业和其所处赛道的价值和空间,进而对投资决策形成参考,亦是确定买入或卖出时点的依据。传统而言,主动研究常用的估值方法分为两类,分别是绝对估值法和相对估值法:
绝对估值法,是指通过对证券的基本财务要素的计算和处理得到该证券的绝对金额,各类基于现金流贴现的方法均属此类,常见模型包括:现金流贴现模型、股息贴现模型、资本现金流模型等。绝对估值具有广泛的实践性,能更准确地反映公司的内在价值,但由于模型涉及参数多,主观性较强,导致结果对参数相对敏感。
相对估值法,主要采用乘数方法将目标企业与其它可比公司进行对比,从静态的角度分析某一股票是否具有投资价值,市值是否有上升空间,常见乘数如市盈率、市净率、市销率等。
当然,主动研究人员在面对不同行业、不同赛道、不同公司时会采用不同的估值模型,参数假设和细节处理充分反映了研究人员的经验和技术。然而,量化从业者在处理“价值”类指标时稍显简单粗暴,直接以相对估值乘数作为因子,暗含可比公司的思想,通过横截面比较来找到被低估的个股,等同于假设全市场的其它标的均是可比公司,秉承均值回复的思路来赚取超额收益。但实际上,这种“相对估值法”的运用一定程度上被“曲解”,由于企业本身的估值存在定价偏差,因而才有价值重估的意义(现金流折现法或者可比公司法),直接使用被扭曲的估值指标去择股自然缺乏稳定性,且违背了可比公司法的逻辑假设。
另一方面,当前传统价值因子虽然在多因子模型中仍占据一席之地,但自2019年之后,其稳定性已大不如前。以BP因子为例,可以看到,以2019年为分界线,前后选股能力呈现较大的差异性,2019年以前,因子Rank IC均值达5.1%,年化ICIR为1.57,但近4年来,IC均值降至3.83%,年化ICIR为1.23,多空收益也下滑明显,尤其是在2019和2020年大盘成长风格强势期间,价值因子对组合几乎是一种拖累。
逐渐的,价值因子在投资实践中更多地充当“安全垫”的作用,甚至有从业人员开始放弃或降低价值因子的权重,虽说在市场下行期间(例如2022年)价值因子仍有一定发挥,但其溢价长期呈现收敛的趋势。
02
本章节中,我们参考可比公司法,借助量化模型模拟主动研究员的估值过程,通过以下几个步骤构造因子:(1)选取合适的可比公司;(2)选取合适的指标;(3)估算目标企业的价值。在选择可比公司时,主动研究人员往往根据业务类型和商业模式主观挑选企业,一般为处于同一细分行业的公司,但从量化的角度,只挑选处于同一行业的企业去进行比较不是一个好的选择:一方面,这与因子行业中性化的处理方式重复,且行业内个股估值变动的同步性较强,大概率会同涨同跌,无法带来增量信息;另一方面,部分公司业务繁多,如果框定在同一行业内进行估值,可能缺少对不同业务分步估值的过程,从而损失有效信息。因此,后文在寻找可比公司时不纳入行业变量。
下面我们针对如何寻找可比公司、如何充分利用可比公司的估值信息以及因子具体的构造逻辑展开深入讨论。
我们曾在20211121发布的《企业生命周期理论如何运用在选股中》引入生命周期这一概念,把公司视作多种产品的集合,依据经营、投资和融资现金流TTM数据的正负性将企业划分至初创期、成长期、成熟期、动荡期和衰退期(其中现金流出现0或缺失值的情况以行业中位数进行填充,银行、非银行金融行业视为成熟期)。
在探讨不同生命周期股票特征的过程中,我们发现所处不同生命周期的企业具有截然不同的定价逻辑和估值特征:对于成长期企业而言,大多处于经营规模快速扩张的阶段,追求的是规模价值,通常具有较高的估值;成熟期企业处于资本扩张阶段,营收增长会受到一定程度的抑制,企业通过协同效应使财务数据结构得到优化,守住甚至扩大市场份额,因此投资者一般不会给予成熟期企业过高的估值;而衰退期则是由于新技术或新产品的进入使得需求偏好的改变,导致公司产品的市场需求逐渐减少,企业的业绩增速也随之下滑,因而估值也处于较低水平(市盈率分布呈现出“跷跷板”现象是由于衰退期企业的“微利效应”)。
长期以来,A股市场中“大盘价值,小盘成长”的说法揭示了投资者对于不同市值企业的定价逻辑截然不同:大市值股盈利相对稳定,成长性有限,分析师覆盖度高且业绩透明性强,从而导致了其上行空间有限,估值一般不会过高;相比之下,小市值股具有较大的增长潜力,上升空间广阔,成长性可期。
另一方面,估值高低也与行业属性相关:以沪深300代表大盘股,中证1000为小盘股。一般而言,弱周期属性行业的估值会高于强周期属性行业,而沪深300成分股中金融、地产的占比仍居于高位,反观中证1000指数,医药、基础化工、新能源、电子等成长性行业由于拥有各自的产业周期,估值通常比银行、地产等行业高。
从大盘股和小盘股估值的历史变化趋势来看,得到几点有趣的结论:首先,从相对的角度来看,大盘价值,小盘成长现象长期存在,至今亦是如此;第二,大盘股和小盘股的估值差处于收敛趋势,差距不断缩小,一方面,宏观经济环境发生了较大的变化,国内经济增速开始放缓,大盘股承压能力相较于小盘股更强。另一方面,行业结构也发生了一定的转变,沪深300成分股中,食品饮料和新能源成为权重最高的两个行业,一定程度上也加剧了沪深300内部的估值分化,并缩小了大盘股和小盘股间的估值差距。第三,小盘股估值波动显著高于大盘股,这与前文的逻辑一致,大盘股业绩透明,且基本面表现相对稳定,因此估值稳定,而小盘股受外部环境影响较大,盈利波动高,导致了其定价偏差较大。
盈利是企业的生存和发展的根本,盈利能力差别较大的企业应有不同的估值逻辑:一方面,盈利能力强的企业资产利用效率高,能源源不断地创造价值,从而提升企业效益;另一方面,盈利能力反映了企业所处赛道或所涉业务的商业模式的优劣。以中信一级行业为例,从毛利率和市盈率的关系可以看出,赚钱能力较强的企业往往会给予更高的估值,食品饮料、医药行业公司具有较强的利润率,从而获得较高的估值。
除此之外,企业运营的效率对于盈利能力的提升起到不小的作用。运营效率主要指企业运营资产的效率和效益,反映了企业利用掌控的资产产生经济效益的能力,即投入产出或成本收益比的最佳状态。其中,资产周转速度是衡量企业营运效率的主要指标。资产周转速度越快,表明资产可供运用的机会越多,使用效率越高,反之则表示资产利用效率越差。企业通过优化内部结构提升运营效率,使利润赚取效率最大化,从而间接达到提升估值的目的。
上一节提到,一家企业的估值(市盈率)往往和其盈利能力呈正向关系。但众所周知,银行股ROE长期表现稳定,在行业中处于中上游水平,但银行板块整体估值偏低。事实上,这一定程度上归结于它的资产结构。由于特殊的商业模式,决定了银行是高负债行业,存在发生系统风险的可能性,当出现一些极端事件时,可能会引发大规模坏账,从而严重到影响银行未来的经营可持续性。普遍而言,负债率较高的企业经营灵活性差,风险性高,不宜给较高的估值。此外,固定资产占比过高的公司也受到较大的制约,此类公司多为上游,无明显技术壁垒,竞争格局较差,若企业无法有效利用资产创造收益,会导致资金效率低下,引起巨大的折旧成本,最后促使毛利、净利率大幅降低,因此,固定资产占比高的企业往往估值偏低。
另外,研发强度同样是区分产业性质的重要标志。部分行业例如计算机,是典型的研发投入密集型行业,通过高研发强度来获得科技附加值,往往具有较高成长性以及估值。相比之下,银行、白酒、家电这类行业几乎没有研发投入,其业务属性不具备科技创新能力。因此,加入研发类指标可以将盈利能力相近,所处同一大类板块或行业,但商业逻辑、业务性质差异较大的企业有效区分开来。
综上,从生命周期、公司规模、盈利能力、经营效率以及经营结构五个维度找寻可比公司,具体指标汇总如下:
在确定可比公司的相似特征后,如何度量公司间的相似程度呢?一般来讲,衡量相似度的方法主要有距离和夹角。常用的方法有如下几种:
欧几里得距离 (Euclidean Distance)
欧几里得距离反映了两点在n维空间中的绝对距离,描述个体间的绝对差异,强调个体特征的相同程度。当n=2或3时,即为日常生活中最常接触的直线距离。但是欧几里得距离不能根据个体各维度或指标的重要程度区别处理,同时对特征进行缩放或转换单位后的结果可能出现较大变动。因此,欧氏距离适合在量纲一致的情况下使用。对于n维向量X(x_1,x_2…x_n) 和n维向量Y(y_1,y_2…y_n),欧几里得距离计算公式如下:
曼哈顿距离 (Manhattan Distance)
曼哈顿距离又称L1-距离或城市区块距离,反映两个点上在标准坐标系上的绝对轴距之总和。曼哈顿距离适用于个体各维度或属性是离散的情况,适用于物体移动路线规划情景。对于n维向量X(x_1,x_2…x_n) 和n维向量Y(y_1,y_2…y_n),其曼哈顿距离计算公式如下:
切比雪夫距离 (Chebyshev Distance)
切比雪夫距离又称L∞度量,在这种距离定义下,两点之间的距离即各类特征差值绝对值的最大值,常用于仓储物流管理。具体来说,对于n维向量X(x_1,x_2…x_n) 和n维向量Y(y_1,y_2…y_n),其切比雪夫距离计算公式如下:
闵可夫斯基距离 (Minkowski Distance)
闵可夫斯基距离是一组距离的定义,包括以上介绍的欧几里得距离、曼哈顿距离以及切比雪夫距离等。对于n维向量X(x_1,x_2…x_n) 和n维向量Y(y_1,y_2…y_n),其闵可夫斯基距离计算公式如下:
在闵可夫斯基距离表达式中,p为可变参数。当p=1时,即为曼哈顿距离;当p=2时,即欧几里得距离;当p趋于无穷,即切比雪夫距离。
余弦相似度 (Cosine similarity)
除了距离,夹角余弦也常用于衡量个体间的相似程度,即余弦相似度。夹角余弦越接近1,个体间的相似程度越高;夹角余弦越接近-1,个体间越是相互背离。相比欧几里得距离,余弦相似度更加侧重相似程度,注重各维度间的一致性,对特征数据缩放或转换单位后对结果影响不大。对于n维向量X(x_1,x_2…x_n) 和n维向量Y(y_1,y_2…y_n),其夹角余弦计算公式如下:
举例来看不同相似度计算方法的区别,下表为A、B、C三家公司研发投入、公司规模、固定资产占比、净资产收益率以及总资产周转率。现以B公司为目标公司,从A、C两家公司中找到与B相似度最高的一家。
直觉上,A公司研发投入占比偏低,规模相对较大,固定资产占比高,ROE相对较低,综合来看属于一家资本密集型公司。B公司和C公司研发投入与ROE显著高于A公司,而公司规模和固定资产占比低于A公司,整体来看是成长型的科技类公司。所以相比A公司,C公司与公司B相似度更高。
对原特征值进行极值缩尾、标准化处理,计算各项相似度指标,结果如下表所示。
结果表明,各类度量指标均能做出正确判断,“A与B”夹角余弦显著小于“B与C”,表明两者在特征空间的位置差别显著。距离类指标整体上也能计算得出B公司与C公司距离更近,相似度更高。然而,不同时期中,各类指标对特征值变动的敏感程度有所不同,相比距离类指标,余弦相似度总体波动较小,对同类型公司的判断结果更稳定。
此外,由于余弦相似度的取值区间为[-1,1],因此还具有可操作性上的优势:一方面,由于距离指标取值范围为[0,∞],且运算结果对数据敏感,难以设定某一明确的距离值来筛选可比公司,若直接以距离小于d或取排名前n%的公司作为可比对象很可能引入干扰样本(实际不可比),使得基于可比公司估计出来的估值偏离真实情况;然而,使用余弦相似度时直接设定阈值可以剔除明显不可比的公司,从而增强了可比公司的可信度;另一方面,基于可比公司法构建因子时需根据公司间相似程度对可比公司的估值信息进行线性组合,利用余弦相似度无需进行过多处理,有效减少了信息损失。结合以上特点,本文选取余弦相似度指标衡量公司间的相似程度。
在计算余弦相似度前,对可比公司的13个特征值在每个截面进行标准化以及缺失值填充处理(生命周期设置为哑变量)。特别的,由于生命周期变量的定义尚无结论,且处于动荡期企业的生命周期特征变动较快,可能会影响整体结果的稳定性,因此通过对其乘0.5适当降低该维度权重。
对相似度的计算结果进行分析,首先,从全市场相似度均值的时序变化来看,中枢处于30.5%左右,总体波动较小,说明余弦相似度作为度量指标的稳定性较强。最高点出现在2017年4月,相似度均值为31.03%,最低点出现在2015年7月,相似度均值为30.16%。
进一步的,定义相似度大于0.9的为高相似度公司,处于0.5-0.9范围的为中等相似度公司,低于0.5为低相似度公司,统计2022年12月30日每只个股的相似度分布,再进行汇总:总体来看,对于目标企业而言,绝大部分企业均为低相似度公司,平均值和中位数约78%,20%的企业为中等相似度公司,而高相似度企业仅在1%左右,再次侧面印证了传统价值因子用法的不合理性。
从行业层面来看,对于银行、非银行金融这一类业务模式相对固化单一的行业,高相似度企业占比较高;高技术制造类行业的高相似度占比整体处于中上游,而周期、消费类行业的高相似度企业占比偏低。我们猜想,一方面与行业股票数有关;另一方面,对于周期性行业,可能是行业的产业周期与经济周期的关联度较高,而各公司间景气度存在错峰,最终反映在财务指标在同一时期存在较大差异;而消费类行业内部的商业逻辑各异,较难一概而论。
为更直观地了解可比公司的计算结果,以贵州茅台为例,可以看到,与贵州茅台相似度最高的五家公司中,同行占比达80%,仅片仔癀属于其它行业,而片仔癀也一度被称为“药中茅台”,不少投资者认为由于两者提价特点、产量限制以及愈久弥珍的共性,两者的定价逻辑是相似的。
总结而言,我们通过计算公司在生命周期、公司规模、盈利能力、运营效率和经营结构特征上的余弦相似度衡量公司间的相似程度,将余弦相似度在0.9以上的定义为可比公司,后文不再赘述。
在主动研究的估值步骤中,确定可比公司后,须选择合适的估值乘数来估算标的价值。不同的是,量化研究能更灵活地追求信息的全面性。因此,在估值乘数的选择上,可对所有价值因子在同一框架下进行重构;另外,对于可比公司估值信息的提取,也可从不同的角度进行因子构造,全方位表征目标企业的估值。
首先,由于可比公司与目标公司的业务和估值逻辑相似,可作为目标公司的估值基准进行参考,因此标的公司的估值可通过可比公司的估值直接定义。其中,中位数、平均值、相似度加权平均反映了目标公司所处赛道的估值中枢水平;可比公司估值的最大值反映了行业天花板,即赛道估值的上限;相应的,可比企业中估值的最小值反映了赛道估值下限。
此外,我们发现,部分公司的可比公司的数量较少,且与可比公司的平均相似程度较低,在估值逻辑上极具“个性”。这一类公司业务层级复杂,或者业务模式“独此一家”,在市场中鲜有同行,因而较难通过可比公司法进行估值。总之,无论是何原因,对此类公司进行估值时都不该直接使用“可比”公司的估值信息,而是综合应用可比公司的估值和目标公司的估值信息。
这里我们的处理方式是,构造估值个性度加权的价值因子,其中个性度指代目标公司估值能被可比公司解释的程度(或者说可比公司估值的可信度),分别用可比公司的估值离散度以及可比公司家数表示:估值离散度的定义参考离差的构建方式,表示为可比公司中EP的最小值/EP最大值,再乘以相似度的均值来计算个性度(权重);由于可比公司家数的区间是[0,+∞],我们通过sigmoid函数对可比公司家数进行非线性转换,压缩到[0,1]的区间内,再乘相似度均值来计算估值个性度。
具体公式如下,公式的左半部分表示目标公司的估值中能被可比公司解释的部分,右半部分表示无法被可比公司估值解释的部分。即对于目标公司而言,可比公司估值的离散度越大,或可比公司数量越少,说明可比公司的估值信息越不可信,难以为目标公司的估值提供参考,应给予较低的权重。
除了基准估值这类绝对意义上的指标外,判断目标公司的估值便宜与否还需将目标公司的当前估值和基准估值进行对比反映其相对估值水平。实际上,目标公司估值与基准估值的差距衡量的是一家企业的估值空间。可比企业估值如同锚定的中枢,若目标企业的估值低于可比基准,说明存在上升空间,未来大概率会上涨。相反,若目标企业估值高于估值中枢,一定程度上说明目标企业当前估值偏高,未来大概率会下跌。因此,定义目标公司价值乘数与可比公司价值乘数中位数的差为价值距离因子,记为DST,定义目标公司价值乘数相对于可比公司乘数中位数的溢价比例为价值溢价因子,记为PRM。
另外,考虑到如果目标公司商业模式优质,未来成长性强,当前时点确实值得被给予较高的估值,那么上述定义方法可能会错失一些热门赛道的投资机会。因此,亦可直接通过可比公司的估值区间宽度定义赛道的成长性溢价:以目标公司的成长性为锚,可比公司中成长性较高的公司估值代表了市场对于这类赛道中业绩快速增长企业的估值兑现情况,而对于成长性较低的可比公司估值理应处于较低水平。也就是说,两组公司之间的估值差距代表了市场对于这类赛道成长性所给予的估值溢价,数值越大,目标公司未来更有可能获得由估值提升或业绩兑现带来的超额收益。
具体而言,根据WIND分析师一致预期复合增速(CAGR)作为未来成长性的代理变量(缺失值用最近一期归母净利润TTM同比增速填充),将可比公司根据预期增速大小分为两组,其中,预期增速高于目标公司的可比公司视为高成长组,低于目标公司的为低成长组,计算高增速组和低增速组的估值差作为因子,用均值定义各组的估值是较为保守的做法,而分别取低增速组的价值乘数最大值和高增速组价值乘数最小值是更为激进的做法,能最大限度地表征赛道成长性带来的估值溢价。
最后,从时间的维度评判目标公司的估值亦是考察估值性价比的一个角度。对此,我们对价值溢价和距离类因子采用时间序列Z-SCORE的处理方式定义时间类因子。其中,分子部分表示当前标的溢价程度与过去一年平均情况的对比,分母部分则是溢价程度的标准差,衡量其稳定性。这样构造的好处在于对于周期性较强的公司,业绩爆发期间往往利润快速释放,但溢价部分往往波动较大,既保留了布局的可能性,又降低在右侧高点买入的风险。
综上所述,我们从基准、空间和时间三个维度定义了价值因子,充分利用可比公司的估值信息饱满了目标公司的估值逻辑。需要注意的是,计算细节上,对于中位数MED、最大值MAX、最小值MIN、距离DST和溢价PRM类因子,为保证基准估值的精确性,取可比公司中相似度最高的前6家进行计算。对于其它因子,取所有可比公司(相似度大于0.9)数据进行计算。
03
从这一章开始,我们将转向实战,考察可比公司法下的新价值因子在选股中的应用,从因子有效性和策略角度探讨在选股中的作用。
具体的,先以EP因子为例,分别测试行业市值中性化后的细分因子在全市场中的表现,回测时间为2013年1月1日- 2023年1月31日,通过Rank IC、年化ICIR、以及分十组年化收益(超额收益比较基准为成分股等权)来判断因子的有效性。进一步的,考察合成价值因子在不同选股域中的表现,以及是否能带来信息增量。
下图展示了13个细分因子在全市场中的绩效表现:所有单因子的Rank IC均值超过了2%,年化ICIR在1.5以上。其中,时间类因子表现最为出色,IC均值接近3%,年化ICIR分别为3.96和3.85,具有极强的稳定性,除此之外,因子的多空收益和多头超额收益同样表现出色。空间类因子表现紧随其后,溢价PRM和距离DST因子有效性同样不俗,而GAP类因子(低增速组EP-高增速组EP)虽然收益预测能力稳定,但多头超额收益十分有限。最后是基准类因子,整体表现相对一般,通过个性度加权改进后的因子表现相对更优,WGT因子(最小值/最大值*相似度均值加权)Rank IC均值达4.28%,年化ICIR达2.13,多空年化收益4.94%,多头年化超额为2.21%。有趣的是,MAX因子多头超额收益为-1.8%,我们猜想,也许是对于部分赛道而言,估值下限越低(可比企业EP最大值越高),说明这一类赛道的商业模式不被看好,前景有限,因此对于崇尚低估值的投资者而言实质上是落入了价值陷阱,需对此保持警惕。
从因子间的相关性来看,时间类因子和空间类因子的特异性强,与其它类别因子的相关系数处于较低水平,且与EP因子和EP分位数因子亦保持相对较低的相关性;另外,与直觉相符的是,基准类因子不仅内部相关性较高,且与EP因子也具有较高的相关性。
综合考虑单因子绩效表现和相关性分析的结果,基准类因子中,我们选取中位数MED、最小值MIN以及个性度加权的两个因子WGT和WGT2;空间类因子中,我们选择溢价PRM、距离DST和高低增速组估值差GAP_AVG因子;时间类因子中则保留全部细分因子。
对于上述9个因子,我们采用截面对称正交的方法处理相关性问题,之后在大类中(基准类、空间类、时间类)等权,大类间等权合成新EP因子,简称为关联EP因子。
对行业市值中性化后的EP_COMP因子在全市场内的有效性进行分析:自2013年1月1日至2023年1月31日,从IC测试的结果来看,总体上关联EP因子对未来收益有显著的正向预测能力,且稳定性极强,Rank IC均值为4.87%,年化ICIR分别为3.49,IC月胜率达85.12%。
从分组收益统计来看,十组收益呈现严格单调,因子收益在多头和空头的分布也较为均匀,多头端(Q10组)年化超额收益约9.6%,空头端(Q1组)年化超额收益约为-7.1%,表现十分优异。
从多空的角度,全市场分10档后,多空年化收益达15.2%,远高于EP因子(6.97%),且最大回撤改善幅度明显,从-18%降至-9.1%。分年度来看,除2017年以外,其余年份均能跑赢原EP因子,改进效果明显。
从多头超额净值表现来看,关联EP因子相比EP因子有显著提升,年化超额收益从4.1%提升到9.6%,且相对回撤从-18%降至-7%,改善幅度明显。分年度来看,在价值风格强势时期,关联EP因子和原EP因子表现相当,而在2019、2020年大盘成长风格横行时期,关联价值因子仍能提供显著的超额收益。长期来看,关联EP因子多头超额的稳定性远强于原EP因子。
为进一步考察EP_COMP因子相对于传统EP因子是否有独立的信息来源,我们对两因子进行对称正交,可以看到,正交后的关联EP因子仍有非常强的选股能力,ICIR几乎没有明显衰减,且多空和多头收益仍十分优异,反观EP因子,虽然仍具备显著的选股能力,但多空收益的衰减力度较大。由此可见,关联EP因子在剔除了EP因子后仍有显著的选股效果,并且优于改进前的EP因子。
最后,对不同参数(可比公司家数TOP N)下关联EP因子的有效性进行稳健性检验:结果表明,因子有效性受参数选择的影响极小,当选择相似度最高的10家可比公司构建因子时,IC均值和ICIR相对更高。
如前文所述,对所有价值因子均在可比公司法的框架下进行重构,待改进的价值因子列表如下:
我们将这9个改进后的关联价值因子进行等权合成,并与原始9因子合成得到的价值因子进行对比。结果表明:在全市场中,大类关联价值因子的选股效果显著,预测稳定性大幅提升,ICIR由2.47提升至3.75,月胜率从74.4%提升至86.8%,多空年化收益提升了3.3%,多头年化超额提升了1.5%。
分指数域来看,在沪深300和中证500这一类偏中大市值的股票池中,价值因子整体的改进效果略逊于小市值股票池,改进后的价值因子在ICIR、多空年化收益、多头超额几乎均有所提升,但提升幅度小于中证1000成分股。我们猜想,由于中大市值的股票大多都被分析师覆盖,且机构调研频率较高,业绩透明度强,导致信息传递、股价吸收的速度快,因此定价偏差相较于小市值股偏低,使得可比公司法对原价值因子的修正效果弱于小市值股票池。
进一步的,考察关联价值因子在不同板块内的选股效果:因子几乎在所有板块中的选股效果均有不俗的提升,其中,医药、上游周期和中游制造改进效果明显,医药板块中多空年化收益由-1%提升至12.04%,多头年化超额从3.2%提升到7.8%。消费和TMT改进效果居于其次。大金融板块中无明显提升,仅ICIR略有改善。
04
最后,为考察关联价值因子对多因子模型的边际贡献,我们以沪深300和中证500指数增强为例,通过将原价值因子替换为关联价值因子提升组合收益和稳定性。
从因子库中的价值、成长、盈利、分析师、价量、北向资金等维度选取有效因子,大类内等权合成,大类间等权合成复合选股因子,具体细节如下:
股票池:全市场A股,剔除ST、涨跌停、停牌、上市不满180天的股票
回测时间区间:2012年12月31日 - 2023年1月31日
调仓频率:月末调仓
基准:中信一级行业、市值暴露、个股权重均以沪深300指数为基准
约束上下限:80%成分股约束,个股偏离幅度1.5%,行业暴露偏离1%,市值暴露偏离0.2,个股权重上限5%
成交价格:收盘价
交易费用及仓位:双边千三,满仓
调仓策略:从价值、成长、质量、分析师、北向资金等维度合成复合选股因子,在风险约束的条件下最大化复合因子暴露,来求解股票的最优权重。
优化模型如下所示:
可以看到,价值因子在改进前后,沪深300增强组合的年化超额收益由10.37%提升至10.88%,提高了0.51%,且跟踪误差和相对回撤均有所改善,信息比由2.27提高到2.38,超额收益风险比有一定提升。
分年度表现来看,改进后策略主要在2013年、2016年、2020年和2021年获得业绩提升,分别提升了5.39%、2.33%和4.1%和2.69%。
同样的,从因子库中的价值、成长、盈利、分析师、价量、北向资金等维度选取有效因子,大类内等权合成,大类间等权合成复合选股因子,具体细节如下:
股票池:全市场A股,剔除ST、涨跌停、停牌、上市不满180天的股票
回测时间区间:2012年12月31日 - 2023年1月31日
调仓频率:月末调仓
基准:中信一级行业、市值暴露、个股权重均以中证500指数为基准
约束上下限:80%成分股约束,个股偏离幅度1%,行业暴露偏离1%,市值暴露偏离0.2,个股权重上限2%
成交价格:收盘价
交易费用及仓位:双边千三,满仓
调仓策略:从价值、成长、质量、分析师、北向资金等维度合成复合选股因子,在风险约束的条件下最大化复合因子暴露,来求解股票的最优权重。
优化模型如下所示:
可以看到,价值因子在改进后,中证500增强组合的年化超额收益由17.31%提升至19.04%,提高了1.72%,相对回撤从-7.7%降至-6.7%,信息比由2.94提高到3.38,超额收益风险比有显著提升。
从分年度表现来看,业绩提升主要发生在2015年、2019年和2020年,分别提升了12.99%、7.79%和7.01%,与价值因子表现萎靡的时期重合,换句话说,关联价值因子较好地帮助组合度过了价值因子的弱势期,同时在强势期与原因子带来的边际增量不相上下,相当于将风格因子“alpha化”,在边际溢价均值提升的基础上大幅降低溢价的波动,从而使得组合长期业绩更为稳定。
05
传统而言,主动研究常用绝对估值法和相对估值法对企业的内在价值进行评估,面对不同行业、不同公司时会采用不同的估值模型,参数假设和细节处理充分反映了研究人员的经验和技术。然而,量化从业者在处理“价值”类指标时稍显简单粗暴,直接以相对估值乘数作为因子,忽略了相对估值法背后的逻辑假设和意义。另一方面,价值因子虽长期仍能提供正向贡献,但稳定性欠佳。本篇报告中,我们尝试借鉴可比公司法,基于财务数据寻找目标企业的可比公司,全方位对价值因子进行重构。
尝试通过量化工具模拟主动研究在相对估值法中的思考路径:从生命周期、公司规模、盈利能力、资产结构和运营效率五个维度定义可比公司,通过余弦相似度计算可比公司间的相似程度。因子构造部分,从基准、空间和时间三个维度重塑了价值因子:基准类因子直接以可比公司的估值定义标的价值,从最大值、最小值、中位数、个性度加权等维度刻画;空间类因子通过计算目标公司和可比公司估值间的距离和溢价表征赛道空间大小;时间类因子则是计算当前估值空间在过去1年中的时序标准分定义相对估值性价比。
从细分因子的测试结果来看,所有单因子的Rank IC均值超过了2%,年化ICIR在1.5以上。其中,时间类因子表现最为出色,年化ICIR分别为3.96和3.85,具有极强的稳定性,且多空收益和多头超额收益同样表现出色。空间类因子中溢价PRM和距离DST因子有效性同样不俗。基准类因子整体表现相对一般,通过个性度加权改进后的因子表现相对更优。
基于单因子绩效和相关性分析,从细分因子中挑选9个因子进行对称正交,之后在大类中等权,大类间等权合成关联EP因子,对行业市值中性化后的EP_COMP因子在全市场内的有效性进行分析:自2013年1月1日至2023年1月31日,关联EP因子都对未来收益有显著且稳定的正向预测能力,Rank IC均值为4.87%,年化ICIR分别为3.49,IC月胜率达85.12%。从分组收益统计来看,十组收益呈现严格单调,多头端(Q10组)年化超额收益约9.6%,且相对回撤降低明显,空头端(Q1组)年化超额收益约为-7.1%,表现优异。从多空的角度,关联EP因子多空年化收益达15.2%,远高于EP因子,且最大回撤改善幅度明显,从-18%降至-9.1%。分年度来看,除2017年以外,其余年份均能跑赢原EP因子,改进效果显著。
可比公司框架下的改进方法对于不同类别的价值因子均有显著提升,具有较强的普适性,合成后的大类关联价值因子的选股效果显著,相较于原价值因子,预测稳定性大幅提升,ICIR由2.47提升至3.75,月胜率从74.4%提升至86.8%,多空年化收益提升了3.3%,多头年化超额提升了1.5%,且在不同指数域和板块中,大类价值因子的表现几乎都有较为明显的改善。
最后,为考察价值因子改进后对多因子模型的边际贡献,我们以沪深300和中证500指数增强为例,通过将原价值因子替换为关联价值因子提升组合收益和稳定性。其中,沪深300增强组合的年化超额收益由10.37%提升至10.88%,相对回撤有一定改善,信息比由2.27提高到2.38;中证500增强组合的年化超额收益由17.31%提升至19.04%,提高了1.72%,且跟踪误差和相对回撤均有明显改善,信息比由2.94提高到3.38,超额收益风险比有显著提升。
风险提示
重要声明
50.《投资者评价基金时会考虑哪些因素?》
49.《多只新股破发,打新收益曲线调整》
43.《打新账户数量企稳,预计全年2亿A类收益率11.86%》
有态度的金融工程&FOF研究
本篇文章来源于微信公众号: 金工严选