登录 注册 返回主站
F10资料 推荐产品 炒股必读

海天瑞声“中文语料”类数据服务本就是公司业务类型范畴内的一种

  • 作者:AA满堂彩
  • 2023-04-03 09:01:37
  • 分享:

有投资者在投资者互动平台提问请问中文语料和贵公司的AI训练数据集是一种东西吗? 如果不是的话,可以给我们科普下中文语料和训练数据分别是什么?分别用在训练大模型的那个阶段?

海天瑞声(688787.SH)4月3日在投资者互动平台表示,按照我们理解,您提到的“中文语料”可能指的是大模型预训练阶段使用的未经标注的原始中文文本数据,大模型通过对大量的原始文本数据的学习来完成预训练阶段的基础能力训练,该类数据服务本就是公司业务类型范畴内的一种;此外,公司现阶段更主要的业务内容是进行更高质量、更具规模化的训练数据生产,即在前述原始数据基础上进行一系列的工程化、结构化人类加工反馈(包括但不限于清洗、标注等),使其成为更高浓度、更容易被算法理解的结构化训练数据,广义上的训练数据可应用于大模型训练的各类环节,尤其是在对于大模型更为重要的强化学习以及垂向拓展等环节。 未来,公司也将紧密跟随大模型等新技术的发展,及时更新公司数据服务能力、及相关业务形态,更好助力相关领域客户的发展。

(记者 张喜威)

免责声明本文内容与数据仅供参考,不构成投资建议,使用前核实。据此操作,风险自担。


温馨提醒:用户在赢家聊吧发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。本文中出现任何联系方式与本站无关,谨防个人信息,财产资金安全。
点赞4
发表评论
输入昵称或选择经常@的人
聊吧群聊

添加群

请输入验证信息:

你的加群请求已发送,请等候群主/管理员验证。

时价预警 查看详情>
  • 江恩支撑:61.29
  • 江恩阻力:68.1
  • 时间窗口:2024-06-19

数据来自赢家江恩软件>>

本吧详情
吧 主:

虚位以待

副吧主:

暂无

会 员:

1人关注了该股票

功 能:
知识问答 查看详情>