克瑞斯汀
博彦科技市场唯一人工数据标注企业,直接受益AI监管法案
一 人工标注是AI训练不可绕过一环
昨日网办AI监管办法的发布,可以清楚看到国内对AI训练数据的特殊要求。相比较gpt等英文模型而言,中文语料的质量和数量均存在巨大差距,一是中文互联网本身环境;二是中文的演变,例如新出现的名词、段子、梗等,因此中文语料数据必须依靠人工来标注。 目前是大语言模型国内处于起步阶段,未来几年仍需收集用户数据,变成训练数据, 进行模型迭代, 缩短差距,这些都绕不过人工标注,所以网办着重强调人工标注培训的必要。
二 人工标注需求即将大增
有些老师可能会说现在有了SAM模型或者GPT4,都可以机器自动标注了还有人工标注什么事? 首先用SAM、GPT4进行标注现在还在想象阶段,而国内AI训练的数据需求是一刻都不会等的。其次人工标注是未来机器标注的基石。如同AI不能替代人类一样,机器标注也不会完全取代人工标注,虽然大多数标注工作是简单的,但许多行业的标注工作需要专业知识,比如在医疗领域的标注员需要把片子中的肿瘤区域标出来;地方方言或外国文字的内容,则需要标注员掌握那门语言。因此,现阶段来看,人工标注的业务量不仅不会被机器分流,反而会因为训练机器而大幅度增加。
三 人工标注唯一上市企业
人工标注行业,巨头很少直接进场,一般采取外包购买的方式(例如OpenAI在肯尼亚数据标注员上万名)。博彦科技是A股目前唯一从事人工标注的,例如博彦调研纪要里提到360与其合作购买数据和标注,公司是百度文心一言首批生态伙伴等。博彦与 BAT、微软、 Meta、谷歌等巨头保持着多年的基础数据业务合作,提供语料、标 注、 训练等服务。数据标注不是独立的业务部门,是博彦基础数据业务的重要一部分,博彦的人工标注业务体量还在不断扩充,同时业务模式比较丰富,学生、个人也可以兼职参加 (线上办公)。
分享:
请输入验证信息:
你的加群请求已发送,请等候群主/管理员验证。
数据来自赢家江恩软件>>
虚位以待
暂无
5人关注了该股票
长期未登录发言
吧主违规操作
色情、反动
其他
*投诉理由
答:博彦科技的概念股是:数据要素、详情>>
答:2023-05-25详情>>
答:信息技术开发、服务,计算机设备详情>>
答:2023-05-26详情>>
答:博彦科技的注册资金是:5.92亿元详情>>
民生证券:纺织行业景气度回升 相关设备有望受益
周一尾气治理概念大跌3.99%,*ST海越跌停
燃料乙醇概念逆势走强,*ST海越以涨幅4.64%领涨燃料乙醇概念
电子身份证概念股涨幅排行榜,数字认证、科创信息多股涨停
克瑞斯汀
博彦科技市场唯一人工数据标注企业,直接受益AI监
博彦科技市场唯一人工数据标注企业,直接受益AI监管法案
一 人工标注是AI训练不可绕过一环
昨日网办AI监管办法的发布,可以清楚看到国内对AI训练数据的特殊要求。相比较gpt等英文模型而言,中文语料的质量和数量均存在巨大差距,一是中文互联网本身环境;二是中文的演变,例如新出现的名词、段子、梗等,因此中文语料数据必须依靠人工来标注。 目前是大语言模型国内处于起步阶段,未来几年仍需收集用户数据,变成训练数据, 进行模型迭代, 缩短差距,这些都绕不过人工标注,所以网办着重强调人工标注培训的必要。
二 人工标注需求即将大增
有些老师可能会说现在有了SAM模型或者GPT4,都可以机器自动标注了还有人工标注什么事? 首先用SAM、GPT4进行标注现在还在想象阶段,而国内AI训练的数据需求是一刻都不会等的。其次人工标注是未来机器标注的基石。如同AI不能替代人类一样,机器标注也不会完全取代人工标注,虽然大多数标注工作是简单的,但许多行业的标注工作需要专业知识,比如在医疗领域的标注员需要把片子中的肿瘤区域标出来;地方方言或外国文字的内容,则需要标注员掌握那门语言。因此,现阶段来看,人工标注的业务量不仅不会被机器分流,反而会因为训练机器而大幅度增加。
三 人工标注唯一上市企业
人工标注行业,巨头很少直接进场,一般采取外包购买的方式(例如OpenAI在肯尼亚数据标注员上万名)。博彦科技是A股目前唯一从事人工标注的,例如博彦调研纪要里提到360与其合作购买数据和标注,公司是百度文心一言首批生态伙伴等。博彦与 BAT、微软、 Meta、谷歌等巨头保持着多年的基础数据业务合作,提供语料、标 注、 训练等服务。数据标注不是独立的业务部门,是博彦基础数据业务的重要一部分,博彦的人工标注业务体量还在不断扩充,同时业务模式比较丰富,学生、个人也可以兼职参加 (线上办公)。
分享:
相关帖子