新股 | 海天瑞声:国内领先的训练数据专业提供商,受益于人工智能蓬勃发展——华创计算机王文龙团队


原标题:新股 | 海天瑞声:国内领先的训练数据专业提供商,受益于人工智能蓬勃发展——华创计算机王文龙团队 来源:蚊子搞科研

华创证券研究所定位为面向专业投资者的研究团队,本资料仅适用于经认可的专业投资者,仅供在新媒体背景下研究观点的及时交流。华创证券不因任何订阅本资料的行为而将订阅人视为公司的客户。普通投资者若使用本资料,有可能因缺乏解读服务而对报告中的关键假设、评级、目标价等内容产生理解上的歧义,进而造成投资损失。

本资料来自华创证券研究所已经发布的研究报告,若对报告的摘编产生歧义,应以报告发布当日的完整内容为准。须注意的是,本资料仅代表报告发布当日的判断,相关的分析意见及推测可能会根据华创证券研究所后续发布的研究报告在不发出通知的情形下做出更改。华创证券的其他业务部门或附属机构可能独立做出与本资料的意见或建议不一致的投资决策。本资料所指的证券或金融工具的价格、价值及收入可涨可跌,以往的表现不应作为日后表现的显示及担保。本资料仅供订阅人参考之用,不是或不应被视为出售、购买或认购证券或其它金融工具的要约或要约邀请。订阅人不应单纯依靠本资料的信息而取代自身的独立判断,应自主作出投资决策并自行承担投资风险。华创证券不对使用本资料涉及的信息所产生的任何直接或间接损失或与此有关的其他损失承担任何责任。

本资料所载的证券市场研究信息通常基于特定的假设条件,提供中长期的价值判断,或者依据“相对指数表现”给出投资建议,并不涉及对具体证券或金融工具在具体价位、具体时点、具体市场表现的判断,因此不能够等同于带有针对性的、指导具体投资的操作意见。普通个人投资者如需使用本资料,须寻求专业投资顾问的指导及相关的后续解读服务。若因不当使用相关信息而造成任何直接或间接损失,华创证券对此不承担任何形式的责任。

未经华创证券事先书面授权,任何机构或个人不得以任何方式修改、发送或者复制本资料的内容。华创证券未曾对任何网络、平面媒体做出过允许转载的日常授权。除经华创证券认可的媒体约稿等情况外,其他一切转载行为均属违法。如因侵权行为给华创证券造成任何直接或间接的损失,华创证券保留追究相关法律责任的权利。

订阅人若有任何疑问,或欲获得完整报告内容,敬请联系华创证券的机构销售部门,或者发送邮件至jiedu@hcyjs.com。

核心观点

✔ 公司是国内领先的训练数据专业提供商。公司是国内领先的训练数据专业提供商。海天瑞声成立于2005年,主要从事训练数据研发设计、生产和销售业务,其训练数据应用于人工智能算法模型的开发训练,涵盖了智能语音、计算机视觉、自然语言等多个核心领域,服务于人机交互、智能驾驶、智慧城市等多种应用场景。目前公司客户累计数量已超500家,覆盖了主要的大型科技公司(阿里、腾讯等)、人工智能企业(科大讯飞、海康威视等)和科研机构(中科院)等。2020年公司营业收入为2.3亿元,毛利率、净利率分别为67.70%和35.17%。

✔ AI基础数据服务市场规模稳步提升,未来品牌数据服务商或占优。算法、算力和数据是人工智能产业链中技术发展的三大核心要素,训练数据是算法模型发展的基础。2019年,我国AI基础数据市场规模达到30.9亿,预计2025年将超过100亿元,复合年增长率超过20%。在细分需求中,图像类数据需求占比近一半。中国AI数据服务市场参与主体包括学术机构、政府等中立机构、需求方自建基础数据团队、基础数据服务商。2019年,基础数据服务商中的数据供应商占据近半壁江山;以公司为代表的前5大企业市场份额超过1/4。随着业务门槛的提升、客户需求多样化等情况,中小型数据供应商或面临经营困境,艾瑞数据显示,2019年中小型数据供应商份额比预期值缩小了20.8%,这部分按7:3让渡给品牌数据服务商和需求方自建数据团队。

✔ 公司多年深耕基础数据服务行业,市场份额占优,技术实力和人才储备具备优势。公司是我国最早的基础数据服务公司之一,积累了丰富的行业经验,为下游客户提供高质量数据产品和定制服务,赢得了如阿里巴巴、腾讯、百度等众多大型优质客户的认可,目前在国内的市场份额位居行业前五,在品牌效益和业务能力方面均有较强的竞争优势。与可比公司对比中,公司营收等弱于Appen,但在训练数据覆盖的语种/方言覆盖能力、成品训练数据集储备数量等方面优于慧听科技、标贝科技。公司积极钻研核心技术,培养了优秀的行业人才,技术横跨基础研究、平台工具和训练数据生产等三大领域,成为公司提供相关产品和服务的重要支撑。

✔ 募集资金助力公司发展。公司本次发行公司股份1070万股,实际募集资金总额为3.95亿元,主要用于自主研发数据产品扩建、一体化数据处理技术支撑平台升级、研发中心升级建设等项目,拓展公司训练数据产品覆盖的场景和领域,提升公司服务效率,增强核心竞争力。

✔ 盈利预测、估值。我们预计公司2021-2023年营业收入增速分别为8.1%、16.7%、20.6%,归母净利润增速分别为1.3%、19.2%、24.6%,预计EPS分别为1.94、2.32、2.89元。估值方面,公司可比公司有Appen、慧听科技、标贝科技等;其中,慧听科技、标贝科技均未上市,Appen为澳洲上市公司。Appen2020财年收入为6亿澳元,净利润为5051万澳元,8月11日市值为15.24亿澳元,以此计算PE(2020)约为30倍。公司目前收入体量与Appen还有较大差距,但净利率远高于Appen。考虑到公司在AI基础数据行业的技术与市场优势,我们给予公司2021年30倍PE,对应目标价约为58.2元/股。

✔ 风险提示:募投项目推进进程存在不确定性、行业竞争加剧。

报告目录

报告正文

1

公司概览

(一) 公司是国内领先的训练数据专业提供商

公司是国内领先的训练数据专业提供商。海天瑞声成立于2005年,主要从事训练数据研发设计、生产和销售业务,其训练数据应用于人工智能算法模型的开发训练,涵盖了智能语音、计算机视觉、自然语言等多个核心领域,服务于人机交互、智能驾驶、智慧城市等多种应用场景。目前公司客户累计数量已超500家,覆盖了主要的大型科技公司(阿里、腾讯等)、人工智能企业(科大讯飞海康威视等)和科研机构(中科院)等。

(二)主要产品和服务

公司研发、生产的训练数据覆盖智能语音、计算机视觉、自然语言处理三大人工智能领域,可广泛利用于算法模型的多个环节。公司主要从事训练数据的研发设计、生产及销售业务,根据业务模式可以分为以下三类:

(1)训练数据定制服务:采取采集+加工服务模式、纯加工服务模式为客户提供训练数据定制服务。最终形成的训练数据集成品的知识产权归属客户。

(2)训练数据产品:公司开发训练数据产品授权客户使用,知识产权归属于公司。

(3)训练数据相关应用服务:为客户定制针对特定应用场景的专属算法模型。

以上产品和服务均以公司生产的专业训练数据集为核心,公司通过设计、采集、加工,最终形成可供算法使用的专业数据集。

公司提供的训练数据已广泛应用。公司提供高质量、大规模、结构化的训练数据助力AI商业化落地,目前,公司提供的训练数据广泛应用于众多主流AI产品及终端应用的训练过程中,覆盖了个人助手、语音输入、智能家居、语音导航等众多应用场景。

(三)营收稳健,毛利率、净利率水平较高

训练数据产品及定制服务为主要收入来源。公司营业收入在2019年前保持高速的增长,2020年受到疫情的影响,导致营业收入出现下滑。从收入结构来看,公司的营业收入主要来源于训练数据产品及定制化服务。

毛利率和净利率保持稳定,且在较高水平。2018年至2020年,公司的毛利率和净利率保持稳定,2020年分别为67.70%和35.17%。归母净利润及扣非归母净利润保持稳定的增长,2020年受到新冠疫情的影响,出现小幅下滑。

(四)公司股权结构清晰

公司股权结构清晰,共14名股东,其中2名为自然人股东,2名为员工持股平台,10名为其他机构股东。董事长贺琳直接持有27.01%股份,并通过控制中瑞安间接持有15.43%股份,合计控制公司42.44%股份,为公司控股股东和实际控制人。(资料来源:招股说明书)

2

行业状况及公司核心竞争力

(一) AI发展带动基础数据服务行业,市场规模稳步提升

数据是AI行业的核心要素之一。算法、算力和数据是人工智能产业链中技术发展的三大核心要素,训练数据是算法模型发展的基础。一方面,AI模型所需的训练数据需要定期更新以拓展模型的应用,另一方面,新兴的应用场景促进AI技术和算法模型的优化,在此背景下,AI产业对于训练数据服务的需求持续产生。中国人工智能基础数据服务产业链可分为数据产生及产能资源、训练数据的生产、AI算法研发。

AI产业市场规模持续扩大,中国AI蓬勃发展。经过多年发展,AI技术的应用场景越来越丰富,商业化能力显著提高。2019年末,我国活跃AI企业位居全球第二,行业融资总额位居全球首位,人才储备综合排名全球第七。(资料来源:艾瑞咨询,招股说明书)

2019年中国AI基础数据市场规模超30亿,其中图像类数据需求占比较大。2019年,我国AI基础数据市场规模达到30.9亿,预计2025年将超过100亿元,复合年增长率超过20%。在细分需求中,图像类数据需求占比近一半。

目前中小数据供应商提供主要供应力量,未来品牌数据服务商或占优。中国AI数据服务市场参与主体包括学术机构、政府等中立机构、需求方自建基础数据团队、基础数据服务商。2019年,基础数据服务商中的数据供应商占据近半壁江山;以公司为代表的前5大企业市场份额超过1/4。随着业务门槛的提升、客户需求多样化等情况,中小型数据供应商或面临经营困境,艾瑞数据显示,2019年中小型数据供应商份额比预期值缩小了20.8%,这部分按7:3让渡给品牌数据服务商和需求方自建数据团队。

(二)多年深耕行业,公司积累丰富的技术和行业资源

公司多年深耕基础数据服务行业,市场份额占优。公司是我国最早的基础数据服务公司之一,积累了丰富的行业经验,为下游客户提供高质量数据产品和定制服务,赢得了如阿里巴巴、腾讯、百度等众多大型优质客户的认可,目前在国内的市场份额位居行业前五,在品牌效益和业务能力方面均有较强的竞争优势。公司营收等弱于Appen,但在训练数据覆盖的语种/方言覆盖能力、成品训练数据集储备数量等方面优于慧听科技、标贝科技。

技术实力和人才储备居于行业前列。公司积极钻研核心技术,培养了优秀的行业人才,技术横跨基础研究、平台工具和训练数据生产等三大领域,成为公司提供相关产品和服务的重要支撑。例如,公司自主研发“一体化数据处理平台”,整合贯通训练数据生产的各个环节,有效提高产能和效率,降低生产成本,缩短开发时间。截止目前,公司已取得26项专利授权,拥有134项计算机软件著作权,处于行业领先地位。

(三)募资情况

公司本次发行公司股份1070万股,实际募集资金总额为3.95亿元,主要用于自主研发数据产品扩建、一体化数据处理技术支撑平台升级、研发中心升级建设等项目,拓展公司训练数据产品覆盖的场景和领域,提升公司服务效率,增强核心竞争力。

3

盈利预测与估值

收入预测:人工智能快速发展带来数据需求不断增大,我们认为公司后续有望恢复快速增长趋势,我们预计2021-2023年公司营收增速分别为8.1%、16.7%、20.6%;

毛利率预测:我们预计2021-2023年公司毛利率为69.7%、69.7%、69.7%;

费用率预测:我们预计2021-2023年,公司销售收费占营业收入比例为5%、5%、5%;管理费用占营业收入比例为10.5%、10.5%、10.5%;研发费用占营业收入比例为22%、20%、18%。

综上,我们预计公司2021-2023年营业收入增速分别为8.1%、16.7%、20.6%,归母净利润增速分别为1.3%、19.2%、24.6%,预计EPS分别为1.94、2.32、2.89元。

估值方面,公司可比公司有Appen、慧听科技、标贝科技等;其中,慧听科技、标贝科技均未上市,Appen为澳洲上市公司。Appen2020财年收入为6亿澳元,净利润为5051万澳元,8月11日市值为15.24亿澳元,以此计算PE(2020)约为30倍。公司目前收入体量与Appen还有较大差距,但净利率远高于Appen。

考虑到公司在AI基础数据行业的技术与市场优势,我们给予公司2021年30倍PE,对应目标价约为58.2元/股。

4

风险提示

募投项目推进进程存在不确定性、行业竞争加剧。

财务附录

具体内容详见华创证券研究所8月12日发布的《海天瑞声(688787)新股定价报告:国内领先的训练数据专业提供商,受益于人工智能蓬勃发展》。

团队介绍

组长、首席分析师:王文龙 

香港城市大学金融与精算数学硕士,6年计算机研究经验,曾任职于广发证券太平洋证券。2015-2017年所在团队取得新财富第6、第4、第3。2019年金麒麟新锐分析师。2020年加入华创证券研究所。

高级分析师:张璋

爱荷华州立大学硕士。2年芯片设计工作经验,5年计算机行业研究经验。曾任职于广发证券和浙商基金,2020年加入华创证券研究所。

高级分析师:孟灿

中南财经政法大学投资学硕士。近4年一级市场TMT投资和3年以上二级市场计算机行业研究经验。曾任职于苏州高新创业投资集团和兴全基金。2020年加入华创证券研究所。

助理研究员:邓怡

厦门大学金融硕士。2020年加入华创证券研究所。