登录 注册 返回主站
F10资料 推荐产品 炒股必读

博彦科技市场唯一人工数据标注企业,直接受益AI监

  • 作者:克瑞斯汀
  • 2023-04-12 12:01:10
  • 分享:

博彦科技市场唯一人工数据标注企业,直接受益AI监管法案

一 人工标注是AI训练不可绕过一环

昨日网办AI监管办法的发布,可以清楚看到国内对AI训练数据的特殊要求。相比较gpt等英文模型而言,中文语料的质量和数量均存在巨大差距,一是中文互联网本身环境;二是中文的演变,例如新出现的名词、段子、梗等,因此中文语料数据必须依靠人工来标注。 目前是大语言模型国内处于起步阶段,未来几年仍需收集用户数据,变成训练数据, 进行模型迭代, 缩短差距,这些都绕不过人工标注,所以网办着重强调人工标注培训的必要。

二 人工标注需求即将大增

有些老师可能会说现在有了SAM模型或者GPT4,都可以机器自动标注了还有人工标注什么事? 首先用SAM、GPT4进行标注现在还在想象阶段,而国内AI训练的数据需求是一刻都不会等的。其次人工标注是未来机器标注的基石。如同AI不能替代人类一样,机器标注也不会完全取代人工标注,虽然大多数标注工作是简单的,但许多行业的标注工作需要专业知识,比如在医疗领域的标注员需要把片子中的肿瘤区域标出来;地方方言或外国文字的内容,则需要标注员掌握那门语言。因此,现阶段来看,人工标注的业务量不仅不会被机器分流,反而会因为训练机器而大幅度增加。

三 人工标注唯一上市企业

人工标注行业,巨头很少直接进场,一般采取外包购买的方式(例如OpenAI在肯尼亚数据标注员上万名)。博彦科技是A股目前唯一从事人工标注的,例如博彦调研纪要里提到360与其合作购买数据和标注,公司是百度文心一言首批生态伙伴等。博彦与 BAT、微软、 Meta、谷歌等巨头保持着多年的基础数据业务合作,提供语料、标 注、 训练等服务。数据标注不是独立的业务部门,是博彦基础数据业务的重要一部分,博彦的人工标注业务体量还在不断扩充,同时业务模式比较丰富,学生、个人也可以兼职参加 (线上办公)。


温馨提醒:用户在赢家聊吧发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。本文中出现任何联系方式与本站无关,谨防个人信息,财产资金安全。
点赞2
发表评论
输入昵称或选择经常@的人
聊吧群聊

添加群

请输入验证信息:

你的加群请求已发送,请等候群主/管理员验证。

时价预警 查看详情>
  • 江恩支撑:7.65
  • 江恩阻力:8.61
  • 时间窗口:2024-07-07

数据来自赢家江恩软件>>

本吧详情
吧 主:

虚位以待

副吧主:

暂无

会 员:

5人关注了该股票

功 能:
知识问答 查看详情>