vm986
ChatGPT 引发了语言大模型狂潮,AI 另一个重大领域 —— 视觉 —— 的 GPT 时刻何时到来?
前两天,机器之心介绍了 。该研究引起了 AI 社区广泛讨论。
而据我们所知,几乎同一时间,智源研究院视觉团队也推出通用分割模型 SegGPT(Segment Everything In Context)—— 利用视觉提示(prompt)完成任意分割任务的通用视觉模型。
SegGPT 与 Meta AI 图像分割基础模型 SAM 同时发布,两者的差异在于
SegGPT &34; 一通百通 &34;给出一个或几个示例图像和意图掩码,模型就能 get 用户意图,&34; 有样学样 &34; 地完成类似分割任务。用户在画面上标注识别一类物体,即可批量化识别分割同类物体,无论是在当前画面还是其他画面或视频环境中。
SAM &34; 一触即通 &34;通过一个点或边界框,在待预测图片上给出交互提示,识别分割画面上的指定物体。
无论是 &34; 一触即通 &34; 还是 &34; 一通百通 &34;,都意味着视觉模型已经 &34; 理解 &34; 了图像结构。SAM 精细标注能力与 SegGPT 的通用分割标注能力相结合,能把任意图像从像素阵列解析为视觉结构单元,像生物视觉那样理解任意场景,通用视觉 GPT 曙光乍现。
SegGPT 是智源通用视觉模型 Painter(CVPR 2023)的衍生模型,针对分割一切物体的目标做出优化。SegGPT 训练完成后无需微调,只需提供示例即可自动推理并完成对应分割任务,包括图像和视频中的实例、类别、零部件、轮廓、文本、人脸等等。
凌云光已参与北京智源机器视觉和计算机视觉的研发。
分享:
请输入验证信息:
你的加群请求已发送,请等候群主/管理员验证。
数据来自赢家江恩软件>>
虚位以待
暂无
0人关注了该股票
长期未登录发言
吧主违规操作
色情、反动
其他
*投诉理由
答:2023-06-19详情>>
答:凌云光所属板块是 上游行业:机详情>>
答:国家制造业转型升级基金股份有限详情>>
答:www.lusterinc.com详情>>
答:凌云光的注册资金是:4.64亿元详情>>
电子身份证概念股涨幅排行榜,数字认证、科创信息多股涨停
今天风沙治理概念涨幅4.22% 节能铁汉、冠中生态涨幅居前
今天数字中国概念在涨幅排行榜排名第6,涨幅领先个股为数字认证、浪潮软件
周二金融科技概念在涨幅排行榜排名第10,数字认证、兆日科技等股领涨
今天电子政务概念涨幅3.53% 旋极信息、数字认证涨幅居前
vm986
ChatGPT 引发语言大模型,AI 另一个重大领域视觉GPT ,请看智源分割模型 SegGPT凌云光
ChatGPT 引发了语言大模型狂潮,AI 另一个重大领域 —— 视觉 —— 的 GPT 时刻何时到来?
前两天,机器之心介绍了 。该研究引起了 AI 社区广泛讨论。
而据我们所知,几乎同一时间,智源研究院视觉团队也推出通用分割模型 SegGPT(Segment Everything In Context)—— 利用视觉提示(prompt)完成任意分割任务的通用视觉模型。
SegGPT 与 Meta AI 图像分割基础模型 SAM 同时发布,两者的差异在于
SegGPT &34; 一通百通 &34;给出一个或几个示例图像和意图掩码,模型就能 get 用户意图,&34; 有样学样 &34; 地完成类似分割任务。用户在画面上标注识别一类物体,即可批量化识别分割同类物体,无论是在当前画面还是其他画面或视频环境中。
SAM &34; 一触即通 &34;通过一个点或边界框,在待预测图片上给出交互提示,识别分割画面上的指定物体。
无论是 &34; 一触即通 &34; 还是 &34; 一通百通 &34;,都意味着视觉模型已经 &34; 理解 &34; 了图像结构。SAM 精细标注能力与 SegGPT 的通用分割标注能力相结合,能把任意图像从像素阵列解析为视觉结构单元,像生物视觉那样理解任意场景,通用视觉 GPT 曙光乍现。
SegGPT 是智源通用视觉模型 Painter(CVPR 2023)的衍生模型,针对分割一切物体的目标做出优化。SegGPT 训练完成后无需微调,只需提供示例即可自动推理并完成对应分割任务,包括图像和视频中的实例、类别、零部件、轮廓、文本、人脸等等。
凌云光已参与北京智源机器视觉和计算机视觉的研发。
分享:
相关帖子