非常感谢开源金工魏博的邀请,今天很荣幸能够跟大家做一个线下交流。从过去两年来看,贝塔加阿尔法产品在行业ETF、指数增强型产品、主动型产品和偏股混合型产品的规模都在持续增加。这种增长背后反映了市场有效性的不断提升以及行业走向专业分工的趋势。在此背景下,过去几年FOF的规模也出现了比较大的迁跃。我们团队在过去半年中的发现,整个市场的平均阿尔法在主动型产品,以及增强型产品中都在下降。市场有效会导致阿尔法下降,所以这是非常正常的现象。我们从微观的投资角度对发生的事件和面临的问题进行总结,同时也尝试了一些解决方案。
首先,在过去的半年中,成长股在主动和被动产品中一直处于不利的状态。我们对成长因子做了一个简单的统计,自2019年,成长因子的表现就打破了过去持续向上的态势。对于沪深300,大家可以发现在这种白马股,或者说是信息非常透明、定价偏离极少的股票中,成长因子或传统意义上的财务成长因子已经处于无效状态;在中证500中,虽然回撤没有像沪深300那样大,但基本上成长因子也失效了;在中证1000中,随着市值的减小,成长因子还是存在一些收益的。因此,我认为我们要讨论市场的风格,首先必须要明确我们所谈论的是哪个市场、哪个板块或者是哪一部分的资产。现在市场中已经有5000多家公司了,市场的宽度已经足够大,因此不存在全市场风格的概念。
进一步,很多投资者就会思考如果成长股不行,是否可以考虑在市场中进行因子的轮动或者行业的轮动。但是实际上,把行业轮动视为一种因子源是有难度的。对于某些投资者来说,可能会结合基本面和宏观层面的研究来实现这种策略。如果能够在市场择时方面做得好,那么其实就不需要做选股等其他事情了。从实盘实践的角度来看,择时实质上是一种在市场上涨时参与,避开跌势的行为,是一种长期的风险回避策略。从更宏观的角度去看,不愿意长期承担风险的人,要么是最聪明的人,已经赚了所有的钱;要么是基本上无法获利,因为收益和风险是成正比的。我们回头看会发现在2021年之前,许多人认为价值投资已失效,大家更愿意投资那些高成长或者预期有高成长潜力的公司,比如新能源和TMT等领域的公司,所以整个价值因子的表现非常差,大家都不愿意选择低估值的资产;从2021年开始,我们可以发现成长价值因子有所回归,特别是在今年在量化和基本面的表现都非常强劲,尽管AI领域很火热,但红利指数几乎是表现最好的一个指数了。盈利类因子也同样并没有那么好的表现,从2021年7月开始,高盈利公司的负面溢价已经消失。在传统框架下的多因子模型中,如果仍然采用线性模型去做反转、动量或等权是十分困难的。
此外,很多投资策略的设计者常常会使用分析师的策略,但是结果也不理想。过去机构和专业投资者获取信息的优势使得跟随分析师的策略能够带来可观的收益,但是在过去的一年中,分析师的预期基本没有产生收益,甚至出现了负向的超额收益。如果跟随分析师评级去操作,会发现胜率不高。我们也根据分析师策略设计了一个多头和空头的投资组合,其中空头部分是以800指数为基准,而多头部分限制了最多购买一个点。由于市场相当有效,在这个中证800组合中并没有太多的可获得的利润。然而,在中证800之外的股票中,像中证1000甚至2000,虽然分析师预期在过去的6到8个月中可能经历了一段回撤期,但总体趋势还是正确的。从数据统计的角度来看,我们发现分析师的预期调整往往偏向于中长期,因此边际变化也会出现一定的钝化现象。也就是随着大家对中长期基本面定价的深入分析,其调整频率变得越来越少,相应的交易机会也相应减少。那么“阿尔法源头”到底在哪里呢?从股票收益的本质出发,在早期的量化投资中,由于散户无法系统地处理财务信息,因此最早的阿尔法策略更多地利用财务信息进行截面套利,这需要依赖信息优势、市场不有效和系统化交易的能力;另一方面,全市场有许多券商和分析师每天都在对各种公司、行业和个股进行研究,能够提供一定的增量和前瞻性的信息;最后一类阿尔法在公募中近年比较常见,一些私募机构之前可能会利用分钟或逐笔数据来获取阿尔法,但随着AI技术的发展,公募也在逐渐建立这部分收益源。主要通过算力加持,对市场中投资者行为进行描述,即通过一些特征和人工智能算法找到一些适用于目前市场环境的交易行为,从而赚取交易对手的钱,这本质上仍然是一种特征工程和套利行为的策略模式。随着人工智能技术的应用,这类阿尔法在沪深300指数的盈利性也逐渐衰减,虽然它没有像基本面策略那样产生极大的负向影响,但通过实盘交易发现在300指数中如果不叠加极高频的交易,只是在中频段进行这种高频交易,那么私募可能已经在你进行交易之前赚取了这部分收益。举一个实际例子,许多高频信号在回测时能够获得收益,但在实盘上可能需要在开盘五分钟内操作完毕才可以获取收益,这是因为实践中会有很多人争夺这些高频交易的收益。在同样的频率下,500指数的情况可能会好一些,但在过去几年中,高频信息低频化的整体超额收益也呈现出一个斜率下降和增长放缓的趋势。另外一方面,最近随着ChatGPT的热度增加,人们更多地讨论AI策略。实际上,AI策略本身并不是非常神秘的东西,目前的基础模型都是开源的。像计算机视觉领域、循环神经网络、ChatGPT和Transformer用的模型,在本质上都是高维特征提取结合高等数学中的连续求导,是一个优化求解的过程。在投资领域中,与一些线性模型相比,AI策略可能有一定的优势。首先,它可以提取一些在原来线性模型中无法发现的高维特征,如果我们能够统计出围绕这些特征引起的定价偏差,就可以在横截面上进行套利。本质上AI策略是线性模型的一个发展。以行业为例,我们可以简单地做一个围绕行业的最基本的交易策略:当行业指数上涨时,卖空其他股票并买入该行业的股票。在这个策略中,我们将整个行业视为一个特征向量,然后围绕这个特征向量来做套利,而AI所做的是将市场投射到更高维的向量。类似于支持向量机的思维方式,实际上就是在一个折叠无数次的高维向量中找到了一个目前还没有被充分定价的贝塔,然后围绕着这个贝塔,利用其产生的定价偏差来进行套利。实际上,AI在投资领域的应用是基于特征工程的基础上实现端对端的策略。随着数据宽度的增加,例如财务数据、交易数据和行业层面的数据,以及一些可以捕捉到的非结构化数据,可以呈现多频段或与其他收益具有较大收益结构差异的的交易特征。从一方面来看,这种方法可以生成新的阿尔法源。这些阿尔法大多很难理解,但确实有效。举两个是我们正在运用的子模型的例子:一个是基于深度学习模型的横截面阿尔法策略,另外一个是时间序列模型,过去几年这两者之间的相关性非常低。进一步,如果我们采用一个比较中性的模型,将各种频段和特征结合起来,结果曲线可能会比较平滑美观。但是,这种方法也会面临一个问题,即你可能不知道其中的细节,因为特征提取的方式是将它们混合在一起的,如果出现问题,可能会束手无策。因此,我提出了一种从特征提取的角度来进行模型分类。其实无论采取什么样的策略,只要使用这种多因子框架来管理风险,并采用线性的、IC的这种统计标准或沟通下的评价体系,我们都可以将这个策略称为systematic策略,也就是一基于大数定理的独立同分布下的套利策略。我认为只要是systematic的策略,其使用的特征向量最终都会被发现,不存在不被别人发现的永远赚钱的阿尔法。随着算力的提高,即使有人不了解你的策略,他们也可以从其他技术角度挖掘出策略的信息。从特征提取角度来看,市场的发展是有限的,但是特征并不是阻碍发展的主要问题。过去,大家更多地将研究资源放在挖掘因子上,但实际上因子挖掘并不是一件特别难的事情。你可以通过机器每天挖出上千个因子,并在其失效之前进行交易。相反,一个定价策略可能只在历史上短期有效,但随着时间的变化,它整个截面上的相关性可能会完全不同,完全变成另一个东西,因此历史上可能没有办法去定义它的表达式并进行完美的回测。但通过这种方法进行交易,其未来的收益安全性可能会更高,风险会更低。但这种方法的实施难度较大,因为投资者对投资事项的理解和愿意去执行的冲突是普遍存在的。那么怎么办呢?在市场上,我认为有几种投资策略。第一种是基于量化和基本面分析的投资策略,这需要一个非常全面的团队来构建知识体系。这个团队可能不需要进行复杂的高频套利交易,但他们仍然可以进行大类资产的配置。比如像我们这样做大类资产的基金经理在这方面比较擅长,我也尝试过做风险因素线性层面的偏离,但是结果都是亏钱的。第二种是是核心加卫星策略。比如有些尽管波动很大,但从经济逻辑角度看应该是可行的。例如,我们过去所说的低估值策略,你可能认为买便宜的东西是没有问题的。但是在过去两年中,随着市场技术的迭代,你会发现PE的基础假设实际上是DCF的贴现,PE的估值体系可能也不是很重要。所以当你认为自己在追求阿尔法时,你可能不自觉地被暴露于贝塔风险之下。因此,我们认为这种策略可能也没有太长的生命力。最后一个要说的是算力和数据的堆叠问题。一些其他工程领域的开源项目在金融领域也有很强的借鉴意义。从数据角度来看,金融行业的数据连续性和广度比其他行业还要高,但问题在于信噪比比较低。因此,目前很多人会采用算力叠加的方法,进行大量的计算,然后通过高换手的方式和特别大的多空敞口来实现策略的设计。虽然公募可能受到交易环境的限制,但在私募已经成为了常规操作。对于公募体系未来的发展,首先自上而下来讲,我们希望能够在局部领域发挥大规模算力的作用,在一些局部股票或同一类型股票中结合其数据特点运用AI算法,寻找或抓住一些阿尔法。因为从全局角度寻找阿尔法策略会面临信噪比降低的问题,并且竞争比较激烈。因此,我认为公募基金可以结合基本面既有的逻辑,分布式地应用人工智能,将其应用于局部领域和行业中,并将其组合成一种自下而上的方式。此外,从自上而下的角度来看,我们需要扩展决策维度的变量。在特征提取方面,我们可以发挥金融行业人员的经验,而不是照搬很多稀有的算法框架。因为这些算法很多是来自工程领域,工程领域的信息和结果有很强的因果关系,而在金融领域反而存在更多的信息噪音。比如在制造业中,我们可以看到新能源行业细分的速度非常快。早些年可能把它归为电力设备板块,但随着产业链的不断延伸,会发现很多新的信息和特征,如果仅依靠机器学习,在反复迭代后信息噪音可能依然很大。因此,更好的方式是与研究员进行交流,了解他们的结论,然后把有限的算力集中用于更有意义的部分。对于游戏、传媒和通讯等领域的逻辑,我们有大量的中端数据可以组织。但在大健康领域,我们发现药物的添加与财务数据之间的关系非常微弱,反而一些行业层面、商业模式层面或医院层面,还有一些学术推广方面的数据,对未来业绩的影响可能更大。因此,借助我们研究员的研究去找出这些特征可能比直接交给AI提取更高效。我认为我们在这方面的这个研究目前还处在学生阶段。在产品方面,我们的布局很宽,从300、500、1000,到创业板增强、2000增强,基本上做到了全覆盖。同时在行业增强方面,我们也布局了医药,科技、制造、新能源以及消费等行业,所以在策略应用中,我们在任何一个局部微观领域都对整个市场阿尔法的理解有一些优势。总体而言,在未来对传统的多因子模型和风险架构,以及AI子工具的应用上,我们希望能够走出高信噪比的一条路。风险提示:上述内容和意见仅作为客户服务信息,并非为投资者提供对市场走势、个股和基金进行投资决策的参考。本公司对这些信息的完整性和准确性不作任何保证,也不保证有关观点或分析判断不发生变化或更新,不代表本公司或者其他关联机构的正式观点。历史业绩不代表未来收益,基金投资需谨慎。做「开源」的量化研究
to be a quant,to be open-minded.
更多交流,欢迎联系:
开源证券金融工程团队 | 魏建榕 张翔 傅开波 高鹏 苏俊豪 胡亮勇 王志豪 盛少成 苏良 何申昊开源证券金融工程团队,致力于提供「原创、深度、讲逻辑、可验证」的量化研究。团队负责人:魏建榕,开源证券研究所所长助理、金融工程首席分析师、金融产品研究中心负责人,复旦大学理论物理学博士,浙江大学金融硕士校外导师、复旦大学金融专硕校外导师。专注量化投资研究10余年,在实证行为金融学、市场微观结构等研究领域取得了多项原创性成果,在国际学术期刊发表论文7篇。代表研报《蜘蛛网CTA策略》系列、《高频选股因子》系列、《因子切割论》系列,在业内有强烈反响。2016年获新财富最佳分析师第6名、金牛分析师第5名、水晶球分析师第6名、第一财经最佳分析师第5名。团队成员:魏建榕/张翔/傅开波/高鹏/苏俊豪/胡亮勇/王志豪/盛少成/苏良/何申昊。
开源证券股份有限公司是经中国证监会批准设立的证券经营机构,具备证券投资咨询业务资格。
本报告仅供开源证券股份有限公司(以下简称“本公司”)的客户使用。本公司不会因接收人收到本报告而视其为客户。本报告是发送给开源证券客户的,属于商业秘密材料,只有开源证券客户才能参考或使用,如接收人并非开源证券客户,请及时退回并删除。
本报告是基于本公司认为可靠的已公开信息,但本公司不保证该等信息的准确性或完整性。本报告所载的资料、工具、意见及推测只提供给客户作参考之用,并非作为或被视为出售或购买证券或其他金融工具的邀请或向人做出邀请。本报告所载的资料、意见及推测仅反映本公司于发布本报告当日的判断,本报告所指的证券或投资标的的价格、价值及投资收入可能会波动。在不同时期,本公司可发出与本报告所载资料、意见及推测不一致的报告。客户应当考虑到本公司可能存在可能影响本报告客观性的利益冲突,不应视本报告为做出投资决策的唯一因素。本报告中所指的投资及服务可能不适合个别客户,不构成客户私人咨询建议。本公司未确保本报告充分考虑到个别客户特殊的投资目标、财务状况或需要。本公司建议客户应考虑本报告的任何意见或建议是否符合其特定状况,以及(若有必要)咨询独立投资顾问。在任何情况下,本报告中的信息或所表述的意见并不构成对任何人的投资建议。在任何情况下,本公司不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。若本报告的接收人非本公司的客户,应在基于本报告做出任何投资决定或就本报告要求任何解释前咨询独立投资顾问。
本报告可能附带其它网站的地址或超级链接,对于可能涉及的开源证券网站以外的地址或超级链接,开源证券不对其内容负责。本报告提供这些地址或超级链接的目的纯粹是为了客户使用方便,链接网站的内容不构成本报告的任何部分,客户需自行承担浏览这些网站的费用或风险。
开源证券在法律允许的情况下可参与、投资或持有本报告涉及的证券或进行证券交易,或向本报告涉及的公司提供或争取提供包括投资银行业务在内的服务或业务支持。开源证券可能与本报告涉及的公司之间存在业务关系,并无需事先或在获得业务关系后通知客户。
本报告的版权归本公司所有。本公司对本报告保留一切权利。除非另有书面显示,否则本报告中的所有材料的版权均属本公司。未经本公司事先书面授权,本报告的任何部分均不得以任何方式制作任何形式的拷贝、复印件或复制品,或再次分发给任何其他人,或以任何侵犯本公司版权的其他方式使用。所有本报告中使用的商标、服务标记及标记均为本公司的商标、服务标记及标记。
开源证券股份有限公司
地址:西安市高新区锦业路1号都市之门B座5层
邮编:710065
电话:029-88365835
传真:029-88365835
本篇文章来源于微信公众号: 建榕量化研究
本文链接:https://kxbaidu.com/post/%E6%9D%A8%E8%B6%85%EF%BC%9AAlpha%E7%AD%96%E7%95%A5%E7%9A%84%E6%80%9D%E8%80%83.html 转载需授权!