海天瑞声:投资者关系活动记录表-海天瑞声2024年度暨2025年第一季度业绩说明会
公告时间:2025-06-09 15:49:45
证券代码:688787 证券简称:海天瑞声
北京海天瑞声科技股份有限公司
投资者关系活动记录表
编号:2025-011
投资者关系活动类别 □特定对象调研 □分析师会议
□媒体采访 √业绩说明会
□新闻发布会 □路演活动
□现场参观 □电话会议
□其他(请文字说明其他活动内容)
参与单位名称及人员姓
参加业绩说明会的广大投资者
名
会议时间 2025 年 6 月 5 日
会议地点 上证路演中心 https://roadshow.sseinfo.com
视频录播+网络文字互动
上市公司接待人员姓名 董事、总经理:李科
董事、副总经理、财务负责人:吕思遥
董事会秘书:张哲
独立董事:杨柳
1、请问针对机器人行业特别是人形机器人领域,
公司可以提供哪些服务?目前市场拓张情况如何?以
及该行业数据来源是什么?
投资者关系活动主要内 董事会秘书张哲答:我司提供的训练数据覆盖智能
容介绍 语音(语音识别、语音合成等)、计算机视觉、自然语言
等多个 AI 核心领域,经过多年人工智能数据服务,我
司已积累了较为丰富的多模态的数据获取与处理能力,
可服务于包括具身智能等在内的多场景人工智能应用
的开发。未来,公司也将持续关注具身智能等新兴领域的发展趋势,并根据客户的需求和技术的变化,适时推进公司产品创新、技术创新,满足更多客户、更新领域的 AI 训练数据需求。
2、行业以后的发展前景怎样?
董事、总经理李科答:受益于全球人工智能产业的高速发展,尤其是多模态大模型以及 AI 应用的持续深化,数据产业将迎来持续的高速增长。根据艾瑞咨询的数据,2024 年中国人工智能基础数据服务市场规模为58 亿元,2028 年规模将达到 170 亿元,年复合增长率为 30.84%。
3、请问海外市场与国内的数据标注市场有什么具体不同?公司将如何开拓海外市场?
董事会秘书张哲答:海外市场更加注重专业化分工,会将更多的数据需求释放给专业的数据服务商,而非自建团队;同时,更注重数据服务商品牌以及数据交付质量,愿意支付更高的溢价,因此往往使得境外收入的毛利水平更高。 为更好把握海外市场发展机遇、进一步扩大全球客户辐射范围,公司从体系搭建、市场研究、品牌升级、营销推广等多维度提升业务、客户触达及服务能力。未来,公司持续加强境外销售团队建设,进一步织密客户服务网络;同时,通过参与全球知名行业及 AI 学术顶会,以及布局搜索广告投放、社交媒体矩阵等多类宣传渠道等方式,向全球市场展示公司先进技术实力及创新产品,提升行业影响力和美誉度。
4、你们行业本期整体业绩怎么样?你们跟其他公司比如何?
董事、总经理李科答:本行业内上市公司有澳大利亚公司 Appen、以及新三板公司数据堂,相关友商信息,
还请您查看相关公司年度报告,谢谢。
5、公司之后的盈利有什么增长点?
董事、总经理李科答:2025 年公司营收增长的核心
驱动力来自 AI 产业的两大发展趋势。首先,多模态 AI技术的快速演进催生了跨模态融合数据的增量需求。随着 AI 从单一文本处理扩展到视觉生成、语音交互等多元模态,市场对高质量图文对数据、细粒度标注语音数据集等高价值多模态数据服务的需求呈上升态势,这为公司业务增长提供了基础。其次,AI 在垂直行业的深度应用创造了新的市场机遇。开源大模型的普及推动 AI在政务、法律合规等专业领域快速落地,这些场景对专业化数据服务的需求将会显著提升。此外,公司去年在东南亚新增建设的数据交付体系已进入爬坡运营阶段,该基地可以帮助公司拓展海外定制服务市场,预计可为公司带来可观的收入增量,并有望成为海外业务扩展新的战略支点。
6、公司给客户做定制数据的过程中积累的经验和数据,能不能转化成标准化的产品来卖?
董事、总经理李科答:客户定制服务涉及的训练数据在交付给客户并完成验收后,所有权完全转移给客户,海天瑞声是不能用于自身产品建设的,这一点是公司始终遵循的知识产权要求。 在定制数据集的生产过程中,积累下来的经验、know-how 会帮助公司各方面能力的提升,例如工具平台因为处理了大量的定制数据集,使平台完善性有很大的增益,加强了公司的数据处理能力;再如,在一些情况下,公司在生产定制数据集时,也会根据对行业需求的判断,在保障数据权属划分清晰的前提下,利用团队管理、资源获取的便利性,同步安排额外的设计、采集和标注工作,完成产品数据集
的开发。
7、请问现在行业里的竞争情况怎么样?您觉得未来这个行业是会越来越集中还是更分散?
董事、总经理李科答:目前来看,市场上数据服务市场主要由品牌数据服务商、客户自建团队以及一些中小数据服务商构成。 未来,公司预判整个数据服务市场将进行重新洗牌,集中度将进一步提升。市场各类主体将会通过在技术研发投入、资源能力建设等主要方面的竞争,逐步淘汰掉那些研发能力弱、资源势力差的品牌服务商和中小玩家。此外,国家对于数据安全及合规要求的进一步趋严,会将那些不具备数据安全合规能力或尚未进行此方面布局的企业逐渐淘汰出局。 在客户自建团队部分,出于其自身对数据和业务的敏感性、保密性需求,可能会与品牌服务商长期共存。
8、公司本期盈利水平如何?
董事、总经理李科答:2025 年第一季度,归属于上
市公司股东的净利润为 37.16 万元,较去年同期增加100.58 万元。
9、咱们的业务规模扩大后,成本是不是能相应降低?规模效应明显吗?
董事、副总经理、财务负责人吕思遥答:公司最大的成本就是原料数据采购费用,即:采集、标注成本。一方面,公司通过继续加大研发投入的力度,全面提升公司的算法能力、工程化能力,加深算法辅助能力与人工工作的结合,达到更佳的人机协同,这样能够做大规模、提升效率、降低成本;另一方面是加强供应链资源管理能力,扩大资源供给,降低单位成本。
10、想请教管理层,今年一季度咱们公司收入增长不错,主要是哪些业务在带动?
董事、总经理李科答:随着多模态大模型的快速迭代及行业应用渗透提速,公司计算机视觉业务和自然语言业务分别同比实现高速增长。其中,在国家对“AI+数据要素”政策同步发力的背景下,以运营商、互联网平台公司为代表的大型客户持续加码高质量图像/视频等多模态数据采购,为其通用多模态大模型训练提供有力支撑;同时,政务、法律合规等场景应用的落地,带动场景类文本数据需求快速增加。在全球化布局方面,公司去年在东南亚新增建设的数据交付体系已进入爬坡运营阶段,通过拓展海外定制服务市场,不仅带来了可观的增量收入,并有望成为海外业务扩展新的战略支点。上述因素,共同驱动公司 2025 年第一季度营业收入显著增长。
11、公司最近有没有在探索什么新的业务方向或者赚钱模式?能简单说说吗?
董事、副总经理、财务负责人吕思遥答:当前,在国家大力推进“人工智能+”行动和“数据要素 X”的战略指引下,公司正积极探索与实践数据产业新业务和新模式。一是按照国家推动公共数据资源的开发利用,发挥海天瑞声的技术优势,与多地政府、地方运营商等开展战略合作,共同探索数据要素市场化与产业化的创新路径,通过构建“数据可信空间”,协助地方政府打造安全、高效、合规的数据治理与流通体系,推动数据要素的价值释放。二是发挥海天瑞声的行业经验和积累,联合当地高校,培训和培养数据标注人才,提升就业率的同时夯实区域数字经济发展人才基础。三是,发挥海天瑞声的生态优势,助力地方及产业园区打造数据标注基地和构建数据标注产业新生态。
12、李总您好,海天瑞声管理层对今年全年的业绩
增长怎么看?最主要的增长会来自哪些业务板块?
董事、总经理李科答:2025 年公司营收增长的核心
驱动力来自 AI 产业的两大发展趋势。首先,多模态 AI技术的快速演进催生了跨模态融合数据的增量需求。随着 AI 从单一文本处理扩展到视觉生成、语音交互等多元模态,市场对高质量图文对数据、细粒度标注语音数据集等高价值多模态数据服务的需求呈上升态势,这为公司业务增长提供了基础。其次,AI 在垂直行业的深度应用创造了新的市场机遇。开源大模型的普及推动 AI在政务、法律合规等专业领域快速落地,这些场景对专业化数据服务的需求将会显著提升。此外,公司去年在东南亚新增建设的数据交付体系已进入爬坡运营阶段,该基地可以帮助公司拓展海外定制服务市场,预计可为公司带来可观的收入增量,并有望成为海外业务扩展新的战略支点。
13、我注意到现在很多公司都在做垂直领域的大模型,想问下这些训练数据主要都是从哪里来的?
董事、副总经理、财务负责人吕思遥答:目前来看,训练垂直领域大模型的核心数据来源可分为三类:公开数据、客户自有数据和垂直场景定向采集数据。其中,公开数据(如互联网知识库、开源数据集和行业标准文档)可以为模型提供基础数据支撑;客户自有数据和定向采集数据则针对具体业务场景进行专项优化。值得注意的是,这些原始数据必须经过专业处理流程才能投入使用,主要包括:1)数据清洗与标准化;2)格式转换(如语音转文本);3)领域专家标注与校验。以智能病历系统开发为例,数据加工流程包括:首先将门诊录音转为文本数据,再由医学专家进行专业校对并提取关键临床信息,最终生成结构化电子病历。这一过程高度
依赖专业领域知识,需要大量临床医师参与质量把控。正因如此,在垂直领域大模型训练中,专业数据服务商扮演着双重角色:既是特定领域高质量数据的提供方,也是专业数据加工服务的提供商。
14、能不能介绍一下目前和三大运营商这些合作伙伴的合作情况?
董事会秘书张哲答:在国家"AI+数据要素"战略的指引下,尤其是国务院国资委连续两年开年启动部署中央企业“AI+”专项行动以来,以运营商为代表的重点央企自 2024 年起加速布局通用+垂向大模型研发,带动了高质量图像、视频等训练数据的规模化采购需求。公司凭借在数据领域的核心优势,已快速成为运营商类客户重要的数据服务供应商。未来,随着以运营商为代表的重点央企在多模态大模型方向的持续加码,以及其基座大模型在更多传统行业的应用落地,预计相关数据需求将进一步增长,为公司收入带来持续的增长动能。
15、DeepSeek 这类大模型很火,不知道这是否会影
响 AI 行业对数据的需求量?公司业务会不会受影响?
董事会秘书张哲答:(1)Deepseek 推出了一系列模
型,其中 V3 模型依然使用了预训练、以及 SFT 等训练