“海量”专题(235)——组合规模、交易成本和大单冲击对因子表现的影响分析
摘要
本文以交易金额占某一时段成交额之比、触发盘口流动性成本和包含大单冲击成本在内的总成本为筛选条件,确定可交易的股票池,并计算相应的因子IC与全部A股中IC的差值,循序渐进地探讨了各类流动性的约束条件和成本对因子表现的影响。其中,换仓频率设定为月度和周度,分别对应长周期和短周期两种策略;涉及的因子有,基本面——ROE和SUE,技术面——换手率、特质波动率、反转和非流动性,高频——大单净买入金额占比、买入意愿强度和尾盘成交占比、深度学习(周度换仓)。
1. 组合规模筛选可交易股票池
我们计算每个股票过去21个交易日全天(月度换仓)或开盘后半小时(周度换仓)的成交额均值,以该数值的5%大于等于组合规模的0.1%为条件,确定股票池。
2. 组合规模对因子表现的影响分析
月度换仓下,ROE和3个高频因子几乎不受影响,而换手率等4个低频量价因子受组合规模的影响巨大。除反转因子外,其余因子的IC都随规模的上升而单调下降。周度换仓下,选股范围的大幅缩窄,对因子表现的影响更加突出。在组合规模达到30亿以上后,绝大部分因子的IC都低于全部A股中的结果。
3. 交易成本筛选可交易股票池
根据前期报告中设计的交易成本预测模型,我们可以得到不同组合规模或成交金额占比之下,每只股票潜在的盘口流动性成本。那就可以把前文统一且固定参数的股票池确定方法调整为,如果某只股票的下单金额大到需要承担盘口流动性成本,即,超过买一或卖一委托金额的均值时,就认定该股票无法完成交易,不纳入股票池。
4. 交易成本对因子表现的影响分析
月度换仓下,除尾盘成交占比外,其余因子的IC几乎都低于全部A股中的结果。而且,随着规模的增加,差距也逐渐拉大;周度换仓下,根据盘口流动性成本确定股票池,因子表现受到的影响较小。
5. 大单冲击成本筛选可交易股票池
在得到估计的大单冲击成本后,我们将其与上一章的交易成本(价格波动、买卖价差和盘口流动性)叠加。若某个股票的总成本超过1%,则认为该股票不可交易,予以剔除。随后,在满足条件的股票池中,重新评估因子的表现。
6. 大单冲击成本对因子表现的影响分析
月度换仓下,纳入大单冲击成本对因子IC的影响整体较弱,只有SUE和特质波动率因子在组合规模超过50亿后,IC有较为明显的下滑;周度换仓下,是出现大单交易的概率及相应的大单冲击成本陡然上升,所有因子的IC相对全部A股中的结果都有较大的改变。其中,特质波动率、换手率和两个深度学习因子的IC都出现了大幅下滑。
7. 风险提示
本报告所有分析均基于公开信息,不构成任何投资建议;权益产品收益波动较大,适合具备一定风险承受能力的投资者持有。
市场流动性对股票交易有严重的影响。例如,当某个股票单日的下单金额高于过去一段时间日成交金额均值的一定百分比时,管理人往往会认为该股票流动性不足,从而放弃交易,并转向流动性更好的股票。这本质上是对选股范围施加了隐形的限制,而且,这种限制会随着管理规模的增加愈发凸显,最终使策略的实际表现与理论收益相去甚远。
因此,在设计量化策略并进行回测时,引入流动性方面的考量,就有着非常重要的意义。由于当前大多数量化策略都基于因子开发,故本文聚焦于股票流动性及其衍生问题对因子表现的影响,尝试为更好地评估和应用因子提供更加贴近实践的视角。
01
市场流动性分析及其对选股范围的潜在影响
1 市场流动性变化趋势
直观上,市场的流动性和行情密切相关。当某一风格、板块、行业或主题成为市场热点时,相应股票的交投活跃,流动性自然变得很好。例如,我们从2014年起,分年度统计不同市值股票的平均成交金额,一窥市场流动性的变化趋势。具体地,把全市场股票按每年的日均成交金额等分成20组,再求组内均值。
由下图可见,不同年份,股票的平均成交金额差异巨大。全面下跌的2018年,各市值组别股票的平均成交金额显著小于其他年份,意味着当年的市场流动性较为紧张;2015年,市场涨幅喜人,投资者情绪高涨,各组别的平均成交额在所有年份中都位列第一,市场流动性较为充裕。
另一方面,日均成交金额最高的第20组与最低的第1组之间的成交金额差异似有随时间拉大的趋势。为了剔除各年份市场自身流动性的影响,更好地观察不同分组日均成交金额的差异,我们计算每一组日均成交金额相对市场日均成交金额中位数的倍数。
由上图可见,2017年以来,随着A股市场机构化程度的提升,日均成交金额最高组别相对市场中位数的倍数逐渐稳定在20倍附近。相反,日均成交金额最低组别相对市场中位数的倍数,则从14年开始逐年降低至23年的0.05倍。
由于我们是对所有股票20等分,因此随着股票总数逐年增加,每个分组中的股票数目也是同步增加的。日均成交金额最大组的相对倍数稳定和最小组的相对倍数下降,意味着越来越多股票的流动性正在变差,这对管理规模较大的基金经理而言,是不得不正视的问题。
2 市场流动性对选股范围的潜在影响
当我们在对量化策略进行回测时,往往习惯于按当日收盘价完成调仓。但实际上,交易信号通常都在盘后生成,因此交易需要等到下一个交易日。然而,这一天中,交易时段的不同会使最终获得的实际收益大相径庭。对于任何一个投资者,无论是看多买入股票还是看空卖出股票,都希望实际收益能够尽可能贴近按前收盘价计算的数值,从而减少因交易问题造成的理论alpha的损失。
为对比不同时段的交易保留股票收益的能力,我们定义收益保存比例为,(收盘价/成交均价-1)/(收盘价/前收盘价-1)。该指标表示按不同交易策略对应的成交价交易,所获得的收益率与理论收益率(按前收盘交易)的比值。下图展示了信号发出后的次日,分别以开盘后半小时和全天VWAP为成交价,得到的收益保存比例。显然,开盘后半小时内完成交易相比全天可保留更多的理论收益(alpha)。
对于换仓频率为月度或更长周期的策略而言,这点差异的影响较小,甚至可以忽略不计;但对周度及以下换仓频率的策略,就会产生巨大影响。因此,在实施短周期策略时,我们建议在开盘后半小时内拆单交易;而当换仓周期为月度或更长时,全天内拆单交易会更加从容。
但是,如果某只股票需要交易的金额较大,同时流动性欠佳,那么即使全天交易,也只能完成预定金额的很小比例。此时,我们就认为该股票丧失可交易性,将其从选股范围中剔除。根据这一思路,我们可对短/长周期策略设计不同的流动性筛选条件。
短周期:交易当天,组合内每只股票开盘后半小时成交金额的5%大于组合规模的0.1%;
长周期:交易当天,组合内每只股票全天交易金额的5%大于组合规模的0.1%。
如以上两图所示,随着组合规模的增长,长周期策略可交易股票的数量及其占比单调下降,但并非线性。当规模≤10亿时,可交易股票的数量未受太大影响。2023年,约在3500-4500只之间。但当规模达到50亿时,可交易股票的数量骤降至1500只;100亿时,仅有1000只左右的股票可交易。
另一方面,随着时间推移,上市公司数量越来越多,组合规模较小(≤10亿)时,可交易股票的数量及其占比2018年以来逐渐上升。但对于50亿及以上的规模,数量则基本稳定在1000-1500只,占比在30%-40%之间。
在周度换仓假设下,由于交易需要在开盘后半小时内完成,故可交易股票的数量及占比对组合规模更加敏感。当规模≥5亿时,就开始显著下降;当规模达到50(100)亿后,可交易股票的数量便不足500(200)只,占比仅为10%(5%)。
综上所述,我们认为,以往基于因子全市场表现所构造的多因子组合,未必能完全适应规模扩大后的产品。利用先验的股票成交金额信息,适当地划定选股范围,然后在其中筛选有效因子,并构建组合或许是更好的方式。
02
组合规模对因子表现的影响分析
根据股票的历史成交额确定选股范围,是应对不同管理规模的常用方法。因此,考察不同组合规模对因子表现的影响,等同于对比在和规模相匹配的各个股票池内,因子的表现差异。
1 组合规模对因子月度IC的影响分析
由下表可见,当组合规模≤10亿时,各因子的IC相比股票池为全部A股的结果,几乎没有任何变化,反转因子的IC甚至还有小幅提升。但当组合规模上升至50亿,SUE、特质波动率、换手率和非流动性因子的IC开始出现下降。当组合规模进一步达到100亿后,这4个因子的IC继续降低。同时,反转因子也受到了一定的拖累。由此可见,组合规模的增大带来的选股范围的缩窄,对部分因子,尤其是低频量价因子的表现还是产生了不可忽视的负面影响。
为了更加清晰地考察因子IC随组合规模的变化,我们以1亿为间隔,计算规模在1-100亿递增的过程中,因子在逐渐变小的选股范围内的IC与全部A股中IC的差值。
ROE和3个高频因子(尾盘成交占比、买入意愿强度和大单净买入占比)在组合规模适中乃至较大时,有更高的IC。这意味着,我们至少无需担心这4个因子在市值较大或流动性较好股票中的表现,会出现大幅衰减。
相反,换手率等4个低频量价因子受组合规模的影响巨大。除反转因子外,其余因子的IC都随规模的上升而单调下降。特质波动率和非流动性因子在规模处于10亿以下时,尚能维持较优的表现。但当规模进一步上升,其IC的衰减幅度也越来越大。反转因子在组合规模高于80亿后,IC也不及全部A股中的结果。因此,我们建议,在应用低频量价因子时,需把组合规模、市场流动性等因素作为关键变量,纳入决策中。
2 组合规模对因子周度IC的影响分析
03
交易成本对因子表现的影响分析
上文根据股票历史成交额确定可交易的股票池时,对所有股票采用了统一的标准。即,过去一段时间内成交额均值的5%大于组合规模的0.1%。其背后的逻辑是,交易不满足这一条件的股票,容易产生过高的交易成本,使得信号在该股票上无法获取收益。但这一标准过于简单粗暴,甚至不合理。每个股票的交易活跃度差异很大,有些股票在交易金额占比超过成交额均值5%时,依然不会有额外的交易成本;而有些流动性差的股票可能在占比达到2%后,就会面临高昂的交易成本。所以,更加严谨的确定可交易股票池的方法是,为每个股票设定交易成本的阈值,如果交易金额过大导致成本高于阈值,则放弃该股票的交易,并予以剔除。
在海通量化团队前期的专题报告——《高频策略交易成本的分析和预测》中,我们将交易成本细分为价格波动、买卖价差、盘口流动性、价格走势和限价单成交概率五个组成部分,并设计了基于高频数据的预测模型,来获得前三部分的估计值。我们尝试将该模型应用于股票池的筛选,以考察这三个部分对因子表现的影响。
1 个股交易成本分析
理论上,无论下单量多少,投资者均需承担价格波动和买卖价差。而且,根据成本计算公式,价格波动和买卖价差并不随下单量的增加而上升。因此,我们首先分析两者是否会对因子表现产生影响。为了避免量纲对结果的干扰,我们直接用收益率减预测的交易成本,再计算IC。即,高成本的股票被放到了空头端。
如上表所示,不论是月度还是周度换仓,也不论是在开盘后半小时内还是全天完成交易,因子IC几乎不受价格波动和买卖价差的影响。这表明,当组合规模变大,投资者虽可能面临更高的交易成本,但其中的价格波动和买卖价差并不会降低因子表现。
那么,交易成本中的第三部分——盘口流动性是如何影响因子IC的呢?我们认为,如果股票的下单量过大,比如使用TWAP策略时,连续“吃”掉对手盘的一档委托订单,那么很容易诱发订单簿向不利于自身的方向变动,产生额外的冲击成本。从而扭曲理论收益,最终降低因子的IC。
前文在测算组合规模对因子表现的影响时,为了计算方便,我们简单地以某个股票一段时间内成交额均值的5%大于等于组合规模的0.1%为标准,挑选可交易的股票。但在计算盘口流动性成本时,组合规模的0.1%和成交额均值的5%便成了两个参数。显然,5亿规模的0.1%和50亿规模的0.1%,交易同一个股票的难度和成本不可直接等同;而50亿规模的0.1%,即500万,同时交易大盘股和小盘股,占成交额均值的比例很有可能截然不同,那么两者对应的成本也将大相径庭。因此,我们对这两个参数分别展开测试,以此获得对盘口流动性成本的直观认识。
首先是组合规模,以下两图展示了规模按1亿的间隔从1-50亿递增时,假设每只股票都以组合规模的0.1%交易,产生的流动性成本,即收益损失幅度的分布。
由图15可见,如果在开盘后半小时内完成交易,随着组合规模的逐步增加,盘口流动性带来的成本越来越大。当组合规模达到16亿时,50%的股票都需承担盘口流动性成本;而当组合规模上升至50亿时,近70%股票的盘口流动性成本超过1‰。
如果是全天完成交易,投资者承担的盘口流动性成本显著降低。即便组合规模达到100亿,也有近70%的股票不存在额外的盘口流动性成本,仅有不到10%股票的盘口流动性成本大于1‰。
其次是占成交金额的百分比,我们计算了每只股票的下单金额占过去21个交易日开盘后半小时或全天成交金额均值的比例,按1%的间隔从1%到30%递增时,对应的流动性成本,即收益损失幅度的分布,结果如以下两图所示。
若是开盘后半小时内完成交易,那么下单金额占21日成交金额均值的比例达到7%时,就有超过半数的股票需承担盘口流动性成本;若是全天,则占比接近18%时,才有一半股票需承担盘口流动性成本。
综上所述,根据前期报告中设计的交易成本预测模型,我们可以得到不同组合规模或成交金额占比之下,每只股票潜在的盘口流动性成本。那就可以把前文统一且固定参数的股票池确定方法调整为,如果某只股票的下单金额大到需要承担盘口流动性成本,即,超过买一或卖一委托金额的均值时,就认定该股票无法完成交易,不纳入股票池。
2 交易成本对因子月度IC的影响分析
我们依然以1亿为间隔,得到1-100亿之间规模递增的100个组合,并假设每只股票的交易金额占比为0.1%。随后,基于3.1节的股票筛选方式得到对应的无盘口流动性成本的股票池,再从收益率中扣除价格波动和买卖价差成本,计算月度因子IC。
由图19-21可见,除尾盘成交占比外,其余因子的IC几乎都低于全部A股中的结果。而且,随着规模的增加,差距也逐渐拉大。但若是对比图12和图20,则可发现,统一且固定参数的股票筛选方法对应的IC降幅要大得多。
我们认为,盘口流动性成本与成交金额大小并不呈严格的线性关系,按成交金额占比确定股票池,可能会高估流动性对因子表现的影响程度,容易误判因子的可用性。
3 交易成本对因子周度IC的影响分析
若是周频调仓,我们仍假设交易需在开盘后半小时内完成,并将规模限制在1-50亿之间变化,其余设定和3.2节完全相同。
04
大单冲击成本对因子表现的影响分析
1 大单冲击成本的定义与计算
首先,我们考察月频调仓、全天交易的假设下,1-100亿元之间按1亿递增的100个不同规模的组合对应的股票池中,因子IC与全部A股中IC的差值。其中,组合内每个股票的交易金额为组合规模的0.1%;计算IC时,收益扣除了总成本。
由图31-33可见,纳入大单冲击成本对因子月度IC的影响整体较弱。只有SUE和特质波动率因子在组合规模超过50亿后,IC有较为明显的下滑。我们认为,这是由于经过总成本的过滤后,剩余股票出现大单交易的概率相对较低,即便出现,产生的大单冲击成本也不高。
其次,我们考察周频调仓、开盘后半小时内交易的假设下,1-50亿元之间按1亿递增的50个不同规模的组合对应的股票池中,因子IC与全部A股中IC的差值。
因为是限定在开盘后半小时内完成交易,所以被过滤的股票数量大大增加。同时,出现大单交易的概率及相应的大单冲击成本也陡然上升。这使得所有因子的IC,相对全部A股中的结果都有了较大的改变。其中,特质波动率、换手率和两个深度学习因子的IC都出现了大幅下滑。上述结果也提醒我们,对于那些在全市场中表现优异的因子,我们仍需审慎地评估,以免过度高估它们在实际应用中的贡献。
综上所述,通过建立VWAP相对作收盘价的收益率和大单净主买金额占比因子的回归模型,我们得到了大单冲击成本的一种预测方式。事实上,并非只有大单会对市场产生冲击,不同类型的主动成交订单在累积到一定程度后,可能都会影响交易成本。而且,这些影响也未必与订单大小呈简单的线性关系。此外,在全天的不同时刻下单,冲击也会不一样。以上种种因素,都需要进一步细化研究。本文的线性模型虽然简单粗糙,但依然不失为一个好的起点。
05
总结与思考
06
风险提示
本报告所有分析均基于公开信息,不构成任何投资建议;权益产品收益波动较大,适合具备一定风险承受能力的投资者持有。
联系人
冯佳睿 021-23219732
余浩淼 021-23185650
本篇文章来源于微信公众号: 海通量化团队