登录 注册 返回主站
F10资料 推荐产品 炒股必读

ChatGPT 引发语言大模型,AI 另一个重大领域视觉GPT ,请看智源分割模型 SegGPT凌云光

  • 作者:vm986
  • 2023-04-08 22:56:32
  • 分享:

ChatGPT 引发了语言大模型狂潮,AI 另一个重大领域 —— 视觉 —— 的 GPT 时刻何时到来?

前两天,机器之心介绍了 。该研究引起了 AI 社区广泛讨论。

而据我们所知,几乎同一时间,智源研究院视觉团队也推出通用分割模型 SegGPT(Segment Everything In Context)—— 利用视觉提示(prompt)完成任意分割任务的通用视觉模型。

SegGPT 与 Meta AI 图像分割基础模型 SAM 同时发布,两者的差异在于

SegGPT &34; 一通百通 &34;给出一个或几个示例图像和意图掩码,模型就能 get 用户意图,&34; 有样学样 &34; 地完成类似分割任务。用户在画面上标注识别一类物体,即可批量化识别分割同类物体,无论是在当前画面还是其他画面或视频环境中。

SAM &34; 一触即通 &34;通过一个点或边界框,在待预测图片上给出交互提示,识别分割画面上的指定物体。

无论是 &34; 一触即通 &34; 还是 &34; 一通百通 &34;,都意味着视觉模型已经 &34; 理解 &34; 了图像结构。SAM 精细标注能力与 SegGPT 的通用分割标注能力相结合,能把任意图像从像素阵列解析为视觉结构单元,像生物视觉那样理解任意场景,通用视觉 GPT 曙光乍现。

SegGPT 是智源通用视觉模型 Painter(CVPR 2023)的衍生模型,针对分割一切物体的目标做出优化。SegGPT 训练完成后无需微调,只需提供示例即可自动推理并完成对应分割任务,包括图像和视频中的实例、类别、零部件、轮廓、文本、人脸等等。

凌云光已参与北京智源机器视觉和计算机视觉的研发。


温馨提醒:用户在赢家聊吧发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。本文中出现任何联系方式与本站无关,谨防个人信息,财产资金安全。
点赞9
发表评论
输入昵称或选择经常@的人
聊吧群聊

添加群

请输入验证信息:

你的加群请求已发送,请等候群主/管理员验证。

时价预警 查看详情>
  • 江恩支撑:15.65
  • 江恩阻力:17.61
  • 时间窗口:2024-06-30

数据来自赢家江恩软件>>

本吧详情
吧 主:

虚位以待

副吧主:

暂无

会 员:

0人关注了该股票

功 能:
知识问答 查看详情>