登录 注册 返回主站
F10资料 推荐产品 炒股必读

海量数据是人工智能发展的必备资源,喂给模型的数据质

  • 作者:金天之娇
  • 2023-02-26 22:13:14
  • 分享:

海量数据是人工智能发展的必备资源,喂给模型的数据质量和数量,一定程度上决定其能力的上限。

回顾ChatGPT的成长史,GPT-2阶段,模型的训练文本包括800万篇Reddit论坛帖子、总计40GB数据,对应的参数有15亿;到了GPT-3,在之前的基础上,OpenAI 的科学家把此前 12 年从6000万个域名中收集的新闻报道、帖子、书籍全文以及各种网页等数千亿个单词的英文资料输入模型进行训练,消耗了数千万美元的计算资源。

在中文互联网语境里,数据资源自然是掌握在BAT等互联网巨头手里。与此同时,他们还拥有创业公司无法企及的“钞能力”。这就意味着,复刻ChatGPT是一场巨头专属的游戏,创业公司在其中的胜出概率无限趋近于0。


温馨提醒:用户在赢家聊吧发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。本文中出现任何联系方式与本站无关,谨防个人信息,财产资金安全。
点赞7
发表评论
输入昵称或选择经常@的人
聊吧群聊
时价预警 查看详情>
  • 江恩支撑:16.4
  • 江恩阻力:18.14
  • 时间窗口:

数据来自赢家江恩软件>>

本吧详情
吧 主:

虚位以待

副吧主:

暂无

会 员:

20人关注了该股票

功 能:
知识问答 查看详情>

添加群

请输入验证信息:

你的加群请求已发送,请等候群主/管理员验证。