蔡卡尔:信息化浪潮下的大数据产业发展机遇
对话实录
高鹏:首先想请问蔡总,伴随着信息化浪潮以及科技行业的发展,未来大数据产业的投资与消费趋势如何?
蔡卡尔:大数据最早属于学术研究上的科学前沿成果,这几年我们感受比较强烈的是,大数据相应的技术应用已经逐渐深入到各个行业当中。不管是在国内还在国外,基于大数据的产业规模正在迅速扩大,并且大数据产业也已经上升到国家战略层面。此外从应用场景或者生态业态来看,近几年云计算的计算框架、大数据挖掘算法有很大的革新。大数据产业是基于科技发展的成果,最终渗透到了各行各业,在经济体量当中扮演重要角色。很多传统行业开始和大数据产业结合,实现转型升级。
2021年11月,工信部发布了《十四五大数据产业发展规划》,这份文件对大数据产业的发展提出了总体目标,基本可以分为几点:第一是创新力强、附加值高、自主可控的现代化大数据产业体系基本形成,预期的年均复合增长率约25%,2025年产业测算的规模将会突破3万亿元。所以从大的产业发展规划中,我们可以预见2023年-2025年的时间窗口,大数据产业的投资会保持较快发展。此外从大数据的技术与行业的融合来看,首先大数据行业有较高的信息化水平和研发能力作为依托。所以目前来看,它与传统行业融合更多是在互联网金融和电信领域。据赛迪顾问统计,2020年大数据产业应用较广的下游领域包括互联网(45%)、政府(14.5%)、金融(9.4%)和电信(8.5%),四个领域占比超过75%,主要的下游行业应用集中于这四块。展望未来,首先在政府端的场景应用,我们感受较强烈的是,最近政府信息化建设某种意义上加深了大数据技术在政务方面的应用。如2022年10月28号国务院发布《全国一体化政务大数据体系建设指南》,指南可以说是数字政府的施工图,其中提到了框架结构是“1+32+N”:“1”代表国家政务大数据平台,“32”指省级政务数据平台,“N”指国务院有关部门的政务数据平台。从建设指南当中,我们可以预见未来三年数字政务领域的大数据应用会有新的突破,所以2023年-2025年,大数据产业不管是投资端还是应用场景的推出都会有较明显的成长性。
高鹏:接下来想请陈总给我们系统介绍下,大数据产业链上下游有哪些细分板块,各板块当前的景气度如何?
陈宝健:大数据是计算机板块比较看好的方向,因为随着数字经济时代的到来,数据会成为新的生产要素,大数据逐渐成为基础性资源和战略性资源,也是非常重要的生产力。随着数字经济到来,各种数据的爆发也蕴藏着非常大的价值。从产业链的角度,大数据产业链按照产业结构可以分成七个模块:第一是大数据的采集,第二是数据的存储,第三是数据的加工,第四是数据的流通,第五是数据的分析,第六是大数据的运用,第七是生态保障,共七个模块,基本上可以覆盖大数据从产生到发生作用的全部过程,即大数据的产业链。
数据采集,包括企业或者政府内部数据采集、外部数据采集、定制化数据采集。数据存储,随着数据量扩大,需要相关的数据的存储、归档的要求。数据加工,加工是对企业采集和存储的数据进行筛选和处理,提高数据的可用性,为数据的挖掘和智能分析奠定基础。很多大数据不能直接使用,需要对数据进行清洗、标注、审核,并且对相关的数据进行数据融合等。数据流通,数据流通是非常重要的环节,只有在流通中大数据才能进一步凸显作用、产生交易,从而放大价值,对资源进行优化配置。在数据流通、交易的时候,会涉及到数据安全,对安全要求较高,涉及到数据的开放共享安全保护、数据确权和数据的隐私等等,里面涉及到很多新的计算技术,如隐私计算等各种安全相关技术。数据分析和数据应用,这些数据用在各个行业,比如说我们用在农业、气象、军工、海洋、工业,让农作物生产更好,提前预测天气预报,让工业生产更加高效等,这都是数据的分析和应用。这是从产业链的角度,把大数据环节分成七块,分别是数据采集、数据存储,数据加工、数据流通、数据分析、数据应用和数据的生态保障,这几块相对景气度较高,我们认为数据流通、数据分析和数据应用,未来景气度有望加速提升。
高鹏:蔡总,经历过估值回调后,当前大数据板块的估值水平和盈利水平如何?
蔡卡尔:从板块出发,选择板块代表性指数,中证数据 (930902.CSI)为代表,它涵盖了大数据产业领域头部50家公司。截至2023年1月13日,如果用市盈率PE(TTM)作为估值参考指标,目前指数估值78倍,绝对水平比较高,目前处于历史68%分位点。原因是有部分公司还未盈利,会影响净利润计算。如果采用市销率来估值,指数目前是2.98倍,位于过去五年26%分位点,所以板块目前整体估值在合理的位置上。此外,从盈利水平来看,2022年前三季度的营业收入同比增速是8%,中证全指前三季度的营业收入同比是7.6%,增速略高于市场整体水平。指数2022年净利润下滑相对较多,前三季度累计净利润下滑46%,全市场为0.38%。所以指数估值水平略高的原因,实际上是利润下滑较明显。主要原因是大数据的产业下游如互联网、政府、金融这三个板块相应的公司,在2022年收入水平、盈利水平存在一定制约。政府主要因为在疫情方面投入会相对多,在信息化建设放缓,对上游相应公司利润端有一定影响。
展望2023年,目前市场分析师对板块的一致预期比较积极。首先是2023年的收入端,万得一致预期全年营收收入增速是12%,比2022年有进一步上行。对于利润端,目前一致预期的净利润增速有43%,一是因为受到2022年低基数的影响,二是伴随着经济复苏,以及政府加快大数据产业发展,利润端修复会更为显著。
陈宝健:大数据产业投资涉及的环节较多,包括采集、存储、安全、分析等,每个环节参与方也较多,如企业、政府或者投资机构等。单就政府的投资来看,过去三年因为疫情的影响,政府更重视疫情防控,对大数据产业投资,或者其他计算机板块信息化投资有一定的影响,从2022年上市公司的业绩预报能看出。在这个背景下,政府还是非常重视大数据、看好大数据的作用和未来发展前景,出台了政策和制定行业标准。如在政府数据开放共享方面,基本上形成了以国家电子政务网站为平台,促进各个部委和省市政务数据共享的内部共享体,以及以部委和地方政府为主体,对社会进行外部数据开放体系。贵州、山西、浙江在2022年都出台政策,如贵州市出台贵州省政府数据共享开放条例,山西市出台的山西省政务数据管理与应用办法,浙江省出台浙江省公共数据条例。说明即使在疫情期间,政府对大数据发展、数据应用、数据共享,出台了很多政策。展望2023年,比较看好政府在大数据领域各个环节投资前景,在数据流通、数据安全和数据应用和分析这一层面,投资大概率是呈现加速向上的趋势,确定性较高。
高鹏:蔡总,市场上成长与价值风格切换如何影响大数据板块的具体投资?
蔡卡尔:大数据板块属于科技领域中的细分赛道,对应的公司多分布于计算机行业,是相对典型的成长风格赛道。从历史估值水平来看,过去五年PE的估值中位数大概是70倍,高水平的估值隐含了较高的成长预期。过去十年,不仅是大数据板块,整个计算机行业的市场风格整体比较偏向成长,特别是中小成长的风格,整个板块就有来自这种风格属性的β收益。为什么会有这样的一个现象?站在2023年,风格切换对大数据板块整体表现有什么样的一个影响?
首先在成长风格相对强势的几年中,通常有几个方面的因素共同催化:第一,相对宽松的流动性,低利率的环境对大数据板块估值中枢的上移有显著的推动作用;第二,产业有很高的景气度,在不断地升级转型中受宏观经济的影响会相对较少,不管在业绩或估值上都有一定的提升;第三,市场交易相对活跃,市场风险偏好较高时,成长型赛道的弹性比较大,也能享受估值的溢价。其中,最核心的是第二个因素景气度。
从逻辑上看,我觉得2023年大概率还是会延续景气投资的思路,大数据产业有可能成为继新能源赛道之后,市场重新关注的热点。主要有两方面的原因。一方面信创板块近期行情火热,国家也在加大投资,大数据产业也是其中的重要组成成分,政策支持上是可以有一定期待的。另一方面,在整个政务系统加快大数据建设的规划下,行业需求的景气度确定性较强。我们能看到公司的业绩成长会在2023年到2025年这三年逐步兑现。
陈宝健:信创板块行情持续的时间比较长,无论从内部或外部环境来看,我们也能看到推进自主可控的必要性,因此信创的市场空间是比较广阔的。根据我们的预测,党政信创+行业信创潜在的市场空间达几千亿,对产业链的公司带来的业绩弹性比较大。并且信创也涉及到核心的硬件,CPU、GPU等,还有一些核心的软件,包括数据库、操作系统、中间件、办公软件,还有一些应用软件,OA、财务系统、邮箱等。
对于教育信息化,主要还是高校的教育信息化。2022年9月,国务院常务会议开始鼓励高校、职业院校和实训基地采购设备、做信息化的更新。因为有贷款贴息的政策的催化和影响,所以高校教育信息化有望迎来新一轮的景气度,所以市场之前关注度也比较高。
针对信创和教育信息化对大数据的影响,我认为信创和教育信息化都会产生很多的数据,新的数据需要存储,保障数据安全,因此数据安全、信息安全这些公司比较受益。随着信创和教育信息化的推进,我认为也会给大数据的行业景气度带来持续加速、持续向上的利好。
高鹏:蔡总,中证大数据产业指数代表大数据产业板块走势,指数成分股动态调整,这在反映行业景气度变化上有何优势?
蔡卡尔:中证大数据产业指数由50家代表性的公司构成,每半年调整一次成分股,成分股的名单在过去几次调整中应该有较大的变化。我觉得从行业投资上来看,这样的调整还是有一定优势的。
首先,陈总刚才给大家分享过整个大数据的产业链,覆盖范围较广。包含7个模块,从采集、存储、加工、流通、分析、应用,还有生态保障。如果我们去看各个产业链的环节,会发现各个环节之间的投入强度差异,在时间序列上,还是有不同的侧重点的。随着产业链的竞争格局变化,各产业链也会有不同的发展速度和成长性。反映在二级市场上,公司的市值变动也比较大。所以我们能看到大数据相关的一些小公司,市值成长的很快,大市值公司就会动态的纳入到中证大数据产业指数中。
此外,大数据产业这几年的发展,主要是与传统的行业进行渗透融合,而且本身能用到的技术也有很大的迭代更新。最典型的像云计算相关的技术应用,其本身的一个技术迭代,叠加传统行业融合下的应用场景,都会有比较明确的新的拓展。只要有这样的一些机会,指数都会快速的纳入到这样的一个指数名单当中。
总结来看,不管是产业链内各环节之间的差异性演变,还是从产业本身的创新,这样的动态调整机制的指数,能更好的捕捉到景气的变化,获得新公司的投资机会。
高鹏:蔡总,能介绍下您所管理的富国中证大数据产业ETF这只产品投资运作情况吗?
蔡卡尔:这个产品简称大数据ETF,产品代码是515400,采用完全复制的方式跟踪大数据产业指数。因此整个产品的持仓特征,与指数的特征是完全一致的。
首先我们从指数编制方案能看到,指数涵盖了大数据产业的各类型业务,包括存储设备、大数据分析、大数据运营平台、大数据生产等大数据领域及应用领域相应的公司。从选出来的范围中,再从头部优选50只市值最大的公司构成指数成分股,从公司本身的行业属性来看,有超过94%的权重来自于计算机行业。这50家公司的核心主营业务主要包括服务器、基础软件、应用软件,网络安全相关的一些产品。与信创的相关性看,整体上信创占比权重接近70%。另外,更细一步来看,把计算机行业再进一步细分成软件开发、IT 服务、计算机设备等。软件开发权重占比57%,IT服务占比28%,计算机设备占比8%。所以大数据产业板块可以认为是整个大的计算机行业里面的子集。
高鹏:最后请陈总结合当前的市场环境,给我们分享下2023年大数据板块的投资展望。
陈宝健:2023年我们对计算机板块比较乐观,我们认为是计算机板块的大年。主要的原因是过去三年计算机板块跌的比较多,很多个股也跌到了历史底部,不管是机构持仓还是估值都在一个比较偏底部的位置。2023年随着基本面的复苏,尤其是信创带来的景气度加速,还有大数据的景气度加速,板块在底部时景气度有了很大的反转,所以我们觉得计算机板块相对来讲机会还是比较大。而大数据板块也是计算机非常重要的细分的领域,大数据其实也有很好的机会,建议投资者重点关注。
再回到大数据的投资机会上,整个大数据的产业链涉及7大模块,数据的采集、数据存储、数据加工、数据流通、数据分析、数据应用还有生态保障。我们认为这几个环节都会受益于板块的一个发展。从我们的角度来看,我们是更加看好数据流通环节,以及数据分析和数据应用的环节。看好数据流通环节的原因是以前很多数据不流通,因为涉及到相关的归属权,还有使用的方式,收费的模式不标准等。但在政府出台一些政策明确之后,数据变得可以能够进行流通,能够进行交易。因为各地也成立了一些数据交易所,使得整体的价值凸显。另外还有数据流通中也涉及数据安全、信息安全。以及数据流通之后,需要对数据进行分析,产生应用价值。
总结来看,2023年看好计算机,看好大数据板块的投资机会,更特别看好大数据环节的数据流通、数据安全、数据分析、数据应用。
做「开源」的量化研究
to be a quant,to be open-minded.
更多交流,欢迎联系:
开源证券金融工程团队 | 魏建榕 张翔 傅开波 高鹏 苏俊豪 胡亮勇 王志豪 盛少成 苏良 何申昊
end
团队介绍
开源证券金融工程团队,致力于提供「原创、深度、讲逻辑、可验证」的量化研究。团队负责人:魏建榕,开源证券研究所所长助理、金融工程首席分析师、金融产品研究中心负责人,复旦大学理论物理学博士,浙江大学金融硕士校外导师、复旦大学金融专硕校外导师。专注量化投资研究10余年,在实证行为金融学、市场微观结构等研究领域取得了多项原创性成果,在国际学术期刊发表论文7篇。代表研报《蜘蛛网CTA策略》系列、《高频选股因子》系列、《因子切割论》系列,在业内有强烈反响。2016年获新财富最佳分析师第6名、金牛分析师第5名、水晶球分析师第6名、第一财经最佳分析师第5名。团队成员:魏建榕/张翔/傅开波/高鹏/苏俊豪/胡亮勇/王志豪/盛少成/苏良/何申昊。
本篇文章来源于微信公众号: 建榕量化研究