金安达:量化拥抱主动的投资实践
金安达:我可以先做一个比较简单的比喻,主动投资就像一个赛车手开赛车,核心是赛车手的技术水平和驾驶经验。传统量化则是在做无人驾驶系统,核心是怎么预先设计模型,用预先设计好的模型尽可能地应对复杂环境,最终实现无人驾驶。而我现在做的基本面量化主动投资框架,则是在做辅助驾驶:这仍然需要有赛车手存在,同时配合模型给出解决方案,共同作出最优决策,辅助驾驶系统如何与赛车手结合是我投资框架的关键点。我也观察到市场上有不同的尝试,比如先量化模型后人工精筛,或先人工初筛后用模型增强的方式进行结合。而我用的方式更像是融合:用量化的方式去实现主动投资逻辑,框架中能量化的部分就用模型实现,不能量化的部分就设计为主动输入的参数接口。顺着刚才的比喻,最终我的模型就像是一个戴着智能头盔的赛车手在开赛车。
金安达:就像每个主动基金经理都有自己的能力圈一样,我这个投资框架下的模型也存在一定局限性。具体来说,第一个方面是目前模型主要专注在成长股上。原因在于基于个股,自下而上的投资框架,在成长股上,存在最为明显的投资规律,同时这个规律可以被模型化。所以我先从成长股入手建模,但在价值股和周期股上的工作还没有完成。主要是后两者的规律性上比成长股弱不少,因此我觉得这是在当前模型适用范围上的局限性。
金安达:这个话题很多人都关注,例如做量化的人通常不太重视股票之间的差异性,只是将一堆个股放在一起处理,做模型化的分析;而主动投资者则更注重个股之间的不同,讲究分析投资逻辑。虽然每个个股都有自己的阿尔法,但是逐个分析后可以找出它们的共性,尤其在成长股上。成长股有一些明显的共性包括成长性、景气度和估值等几个核心要素。只要解决这些核心要素的刻画、评价和权衡等问题,就可以比较好地模型化成长股的投资。长期来看,成长股的本质是赚取业绩增长所带来的收益。股票价格P等于市盈率PE乘以每股收益EPS,所以P的变化来源于估值和业绩的变化。虽然短期估值变化占主导,但长期来看业绩是赚取收益的关键。市场上成长股基金经理数量众多、高手如云,但核心要素总结下来就是成长性、估值(性价比)以及景气度(未来预期)。我将这些方面用模型实现,并构成了模型的核心部分。
不同个股确实存在差异,因此我的核心模型首先是去刻画最主要的共性,然后用局部模型去刻画局部的共性。之后剩下的是个股自身的特性,因此需要进行个股研究,这也是量化和主动结合的过程。最开始提到这个框架是辅助驾驶系统加赛车手的模式,所以我也需要和主动基金经理一样,尽可能地把每个筛选出来的标的都了解一下,确保筛选出来的个股是否保持一致性,有没有出现明显的偏差?模型框架在此基础上对全市场的所有个股进行跟踪,而不是像传统量化那样定期选一选。如果个股成长性、预期、估值或由其他重大事件产生了变化,个股的触发条件也会不一样,可能被纳入或剔除。所以,我们的股票池是一个动态变化的过程,是由基本面主动量化产生的优质股票池。如果有新的个股进入我的股票池,我会研究这些新的标的,与研究员和行业专家进行沟通和交流,这与主动基金经理没有本质上的差别。目前,我的股票数量大约保持在130到140个左右,平均每周会有几个标的变动。从本质上来看,这个框架和主动基金经理是类似的。很多自下而上的主动基金经理喜欢把自己比喻为在海边翻石头,那我的模型就像是用一只机械手在疯狂翻石头。
高鹏:华夏基金量化在机器学习应用方面较为前沿,您认为AI模型在您的主动量化模型中有何帮助?
金安达:华夏基金的数量投资部确实在机器学习应用方面比较前沿,也投入了大量的资源。不过目前我的模型框架底层是基于个股投资逻辑构建的,日常选股交易相对比较低频。而且很多AI算法需要足够的数据量,所以我们在具体选股模型的核心算法上,没有用到复杂的AI模型。在文本数据处理方面,我们也会用NLP模型来进行一些文本处理分析,但是这块要做出差异化的难度不小。最近ChatGPT很火,如果能使用上的话,我觉得在未来一定会带来很多帮助。目前我认为,投资逻辑才是模型框架的灵魂。然后把投资逻辑能合理拆分,再通过建模实现是关键。算法越高级,结果不一定就越好。只有逻辑清晰了,哪怕是线性回归得到的结果也远远好于逻辑不清晰情况下用各种复杂模型得到的结果。
说回AI模型,我相信AI模型肯定能锦上添花。我目前主要在尝试如何更好的利用AI模型,比如利用NLP模型来分析处理个股纪要、内部报告等文本数据内容。之所以想往这个方向去探索尝试,是因为这些数据也是主动基金经理重要的投资信息来源。所以我的目标也是去构建一个模型,来模拟主动基金经理对这些信息的提取和判断,再将这些信息与个股的基本面信息结合分析、与相同业务的竞争对手基本面信息结合分析,还有如何将行业调研纪要内容与个股预期更好地关联起来等等。不得不说这个过程难度很大,所以我们也在不断探索中。
高鹏:机构抱团配置主流赛道股,不同赛道的抱团和瓦解过程,对您的投资策略框架有哪些影响?
金安达:结论是确实有影响。当机构抱团配置主流赛道股时,短期的市场投资机会是过度集中的。这种情况下,市场往往会不断自我强化乐观预期,然后基本面预期越看越远,甚至直接用遥远未来的终局来反推当下估值。这种情况下模型对我没有什么帮助,如果非要参与的话,我就是和其他主动基金经理一样,进行基本面认知上的PK。在基本面认知PK上,较为依赖个人经验、基本面认识、相关专业知识、甚至天赋,这块只能说我认为自己并没有太多优势。所以如果不得已参与的话,我的目标也只要能跟上市场表现就行。就像是开车进入了一个拥挤的赛道,这个时候辅助驾驶系统能发挥作用就很有限了,更多要靠驾驶员自己进行实时应对和微操,然后跟着车队一起前行,不要被落下就行。
具体来说,我也构建了一个行业情绪跟踪模型和机构抱团程度刻画的模型,当出现机构抱团配置主流赛道股,并且相对模型选股表现出明显超额收益时,我会往模型参数中注入一些主动调整的参数进行适当干预,使得选股结果向赛道股进行一些倾斜。但是长期来看,没有业绩支撑的赛道股,当估值达到一定阶段后都会瓦解。有业绩支撑并且估值没有泡沫化的赛道股,模型也都可以正常筛选到。但是最后的泡沫化阶段,即便是加入了一些主动参数干预也不能选到赛道股时,我就选择不参与了。本质上来说,就是收益风险比已经过低。
在赛道股瓦解时,对我的模型框架影响不是很大,反而会得到一定的超额收益。因为这个时候,从赛道股出来的资金开始会去寻找新的投资方向。那么原先那些相对不是很热门的优质成长股,会得到估值提升的机会,形成短期超额收益。
高鹏:在您的主动量化策略框架中,如何看待行业轮动模型和风格轮动模型的配置价值?
金安达:我的模型框架中对轮动的判断较少。因为是自下而上形成的一个模型框架,我认为行业轮动或风格轮动本质上是个股自身变化叠加后呈现出来的结果,并不是关键的股价自变量,对应也就更加不是个股启动涨跌背后的驱动因素。但是市场有意思的点就在于充满了反身性,局部是没有那么有效的。那么资金会因为部分个股的涨跌而关联到潜在行业的整体变化,然后去寻找潜在上下游的相关标的,或者去寻找间接受益的标的。从主动的角度,就像当一个投资机会出现时,往往先炒核心龙头,然后开始进入扩散逻辑寻找二线标的。我想这可能是出现行业轮动或者风格轮动的一个重要原因。并且目前观察下来能发现,市场对投资机会挖掘的越来越细,明显可以感受到行业轮动在加快。从量化角度来理解,如果能把这些投资信号刻画成一个信号曲线,那么就是这类投资机会的信噪比在降低,信号曲线从原来大开大合的大曲线,现在变成了频率更高的小曲线。
我把行业轮动和风格轮动作为一个风险项来对待,而不是把他们作为alpha来源。所以我在模型选股后,进行组合构建时,会有一个组合优化的过程。这个过程中,我加入了对行业偏离和风格偏离的控制。控制依据,会主要参考公司内部研究员的观点,宏观策略上对行业和风格的判断,行业研究员对行业风险的判断。我对自己模型的组合优化做了改造,因为原先大家做组合优化,最优化目标基本都是最大化预期收益率或者在减去组合波动惩罚项。其实这个从主动投资的逻辑出发,逻辑存在问题。最大的问题就是预期收益率是很不准确的。所以我把这一块也改掉,主要是改了目标函数,对整个组合看好程度的判断,让结果更加合理稳健。
高鹏:近期公募量化对标偏股型基金指数(885001)增强的产品逐渐兴起,您对这类产品如何看待?
金安达:公募量化都在尝试构建一个对标偏股混合型基金指数的增强产品。因为长期来看,偏股混合型基金指数能明显跑赢各类宽基指数。要是能实现增强的话,肯定会比较受欢迎。而且可以让量化产品能更加直接地与全市场主动基金进行竞争了。但是这类产品与其他宽基指数增强产品最大的差异就是,这个基准是没有成分股的。偏股混合型基金指数是一个每日全市场偏股混合型基金收益率均值来合成的,没有成分股。但是做增强有必须要有成分股在才行。
所以目前主流方法就是先根据最新期的基金重仓持股来模拟一个可能的成分股,模拟出一个结果上与偏股混合型基金指数一致的指数,然后再在这个成分股基础上做增强。这种方式是量化擅长的,只要模拟出成分股后,用多因子模型、价量模型做增强,都会比较容易,整个过程会比较顺。但是主要的问题也在于,主动实际持仓和最新一期的持仓存在滞后性,要弥补这种滞后又会加入比较多的其他因素,导致结果不一定足够稳定,如何能控制好,需要不少细节控制。另一种,就是从主动投资的逻辑出发,主要在选股逻辑上和主动投资尽可能去接近,至于具体成分股,考虑相对少一些。目前我在走这后面这一条路径,两种方法都有优劣,目前我觉得都是值得尝试的。我也相信会有很多优秀的产品出来,给投资者提供更多投资选择。
高鹏:您如何看待未来量化与主动结合这种投资方式的发展趋势?
金安达:我认为与其说量化与主动结合,不如说是量化技术不断渗透主动投资框架。我很看好量化与主动结合的这种趋势,甚至我认为是一种必然的趋势。
量化的比较优势在于强大的工具性。就像100年前,股票大作手利弗莫尔通过记录bid-ask然后看出了股价趋势,在我眼里这就是对股价数据的量化挖掘,让他比同时代的投资者有了额外的优势。后来有人发明了各种技术指标、波浪理论等,其实也是基于对市场走势认识后的一种量化模型。随着技术进步数据完善,大家开始更加关注财报,开始在excel上搭建DCF模型,这也是量化技术对主动投资的渗透。
现在随着AI技术各种算法涌现,我觉得这些会和以往一样不断渗透到主动投资中去。也许未来一个合格的主动基金经理都得是会写基础代码的基金经理了。而且投资者对市场的经验积累存在边际递减的效应。5年投资经验肯定是完胜刚入行的从业者,但是10年投资经验和5年投资经验相比,优势就边际减弱了一些,15年投资经验和10年投资经验相比,可能实际投资经验上就差异不是特别大了。但是技术的加持就像是生产函数中的全要素生产率,是会有客观差距的。从这点上看,当主动投资的经验差异缩小时,按照基金行业这么卷的情况下,把量化技术加入主动投资也是一个很值得尝试,性价比极高的选项。
高鹏:最后能介绍下您旗下所管理的华夏睿磐泰盛的投资运作情况吗?
金安达:华夏睿磐泰盛是一个固收+产品,股票仓位在0-30%,我负责权益部分投资,固收部分由华夏一位资深的债券基金经理毛颖负责。产品定位上,目标长期年化收益6%以上,控制最大回撤在4.5%以内。产品权益部分投资框架,是在核心的基本面量化主动投资框架基础上,加入了宏观择时模型和回撤控制算法。在具体模型选股参数上,针对固收+产品做了一些调整:在组合优化时会提高对于风险厌恶的程度,在行业偏离上进行适度调整。
具体主要是四个步骤。第一步,确定股票仓位。这里会用到组合资产配置策略和最大回撤控制算法,主要为了控制组合回撤和极端波动。第二步,优选股票池。在确定股票仓位后,运用基本面量化主动模型筛选出全市场优质股票池,并且与研究员一起主观剔除存在极端风险的标的。第三步,组合优化得到个股权重。就是在优质股票池的基础上运用改造后组合优化器,构建出组合个股和对应权重,组合优化的参数调整会充分利用宏观策略和行业研究员的观点。第四步,个股交易。具体个股交易策略设计上,涉及个股止盈止损和动态再平衡,债券端主要以信用债为主,少量配置可转债。今年以来,产品整体表现还算良好。目前都是在按照既定的投资流程进行投资决策。
(全文结束)
(纪要整理:蒋韬,姚烨,林希民)
做「开源」的量化研究
to be a quant,to be open-minded.
更多交流,欢迎联系:
开源证券金融工程团队 | 魏建榕 张翔 傅开波 高鹏 苏俊豪 胡亮勇 王志豪 盛少成 苏良 何申昊
end
团队介绍
开源证券金融工程团队,致力于提供「原创、深度、讲逻辑、可验证」的量化研究。团队负责人:魏建榕,开源证券研究所所长助理、金融工程首席分析师、金融产品研究中心负责人,复旦大学理论物理学博士,浙江大学金融硕士校外导师、复旦大学金融专硕校外导师。专注量化投资研究10余年,在实证行为金融学、市场微观结构等研究领域取得了多项原创性成果,在国际学术期刊发表论文7篇。代表研报《蜘蛛网CTA策略》系列、《高频选股因子》系列、《因子切割论》系列,在业内有强烈反响。2016年获新财富最佳分析师第6名、金牛分析师第5名、水晶球分析师第6名、第一财经最佳分析师第5名。团队成员:魏建榕/张翔/傅开波/高鹏/苏俊豪/胡亮勇/王志豪/盛少成/苏良/何申昊。
本篇文章来源于微信公众号: 建榕量化研究