登录 注册 返回主站
F10资料 推荐产品 炒股必读

概念掘金 | 国产版Sora横空出世!Vidu概念“新衣”一穿,再迎爆炒?

  • 作者:君子好逑
  • 2024-04-28 12:02:04
  • 分享:

今年2月,OpenAI发布视频生成模型Sora,一个首次由 AI 生成了长达1分钟的多镜头长视频,输入寥寥数语便能生成效果炸裂视频,镜头感媲美专业电影,震惊全球。

随后,全球掀起了一场关于Sora的讨论风暴,犹如23年的ChatGPT热潮,很快有大量 AI 公司开始以做“中国版 Sora”为目标。

二级市场,sora概念也是在当时迎来一波爆炒,板块指数在一个月时间,最高涨幅近55%。

个股在近一个月(24个交易日)内更是杀出四只翻倍牛股,其中因赛集团位居榜首,最高涨幅超132%;中广天择涨超125%,华策影视涨超115%,安诺其涨超103%;涨幅超30%个股便有13只。

4月27日上午,在2024中关村论坛上,生数科技联合清华大学发布中国首个长时长、高一致性、高动态性视频大模型——Vidu,它所展示的效果立刻刷屏。这是国内首个全面对标 Sora 的视频模型。

全面对标Sora,

可生成16 秒、1080P 视频

根据官方描述,Vidu 模型融合 Diffusion 与 Transformer,开创性创建了 U-ViT,支持一键生成长达 16 秒、分辨率高达 1080P 的高清视频内容。

更令人惊喜的是,“Vidu”画面效果非常接近 Sora,在多镜头语言、时间和空间一致性、遵循物理规律等方面表现都十分出色,而且还能虚构出真实世界不存在的超现实主义画面,这是当前的视频生成模型难以实现的。

作为中国自研视频大模型,Vidu还能理解中国元素,能够在视频中生成例如熊猫、龙等特有的中国元素。

值得一提的是,短片中的画面是连续生成的,没有出现插帧的情况。这表明Vidu采用的是一种“一步生成”的方法,与Sora类似,它能够直接且连贯地将文本转换成视频。在底层的算法实现上,Vidu使用的是一个单一的模型,实现了从文本到视频的完全端到端生成,没有涉及到中间的插帧或其他多步骤的处理过程。

从这里就能看出来,未来,不管是在影视剧行业,创意广告行业,还是其他视频应用的领域,都将见到 AI 的影子,而Vidu作为能理解中国元素的国产大模型,必定会大放异彩。

背后技术,专业性描述来说,Vidu模型采用的是团队原创的Diffusion与Transformer融合的架构U-ViT。

该架构由团队于2022年9月提出,早于Sora采用的DiT架构,是全球首个Diffusion与Transformer融合的架构

2023年3月,团队开源了全球首个基于U-ViT融合架构的多模态扩散模型UniDiffuser,率先完成了U-ViT架构的大规模可扩展性验证

背后创业公司已融资数亿元

Vidu的背后,是一家来自清华的明星创业公司北京生数科技有限公司(简称“生数科技”)。

生数科技成立于2023年3月,核心团队成员来自清华大学人工智能研究院,此外汇集了来自阿里、腾讯、字节等知名科技公司的顶尖人才,是全球范围内领先的深度生成式算法研究团队,拥有扩散概率模型底层创新研发能力。

据悉,生数科技的研发和原创能力非常强悍,已在全球顶级期刊arxiv上发布了超过15篇技术论文,这也是其能原创Vidu架构的重要原因之一。

天眼查数据显示,生数科技目前共完成3轮融资。

2023年6月19日,完成近亿元人民币天使轮融资,投资方包括蚂蚁集团、BV百度风投、卓源亚洲、卓源资本。

2023年8月20日,完成数千万人民币天使+轮融资,投资方为锦秋基金。

最新来看,2024年3月12日,生数科技刚刚完成新一轮数亿元融资。由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲继续跟投,华兴资本担任独家财务顾问。

在三轮融资总计数亿元人民币的资本加持下,生数科技已成为目前国内多模态大模型中估值最高的初创公司之一。

附概念股👇

因赛集团 公司InsightGPT具备文生文、视频智能剪辑、图生视频等功能,目前正在开发文生视频功能。

中广天择 公司是全媒体优质视频内容提供商,根据万兴科技2024年1月31日官微, 万兴科技正式宣布与长沙广电国有控股上市公司中广天择达成战略合作 。

引力传媒公司内部自研上线“核力 AI”的 1.0 版本、已具备“营销文案 生成”、“图片识别与生成”及“数字分身复刻及驱动”等功能应用。

华策影视公司去年组建了AIGC应用研究院,自研的编剧助手、剧本评估、视频检索、AI剧照等功能已在内部应用或内测。通过对开源技术的学习吸收和消化,目前技术储备已可实现4秒时长的文生视频。

万兴科技天幕大模型主要基于公司在数字创意领域二十年的产品开发与运营经验而打造的音视频多媒体大模型,具备多媒体、垂直解决方案、算力数据及应用本土化等特色。

国脉文化公司在文生视频方面,已内部开发基于大模型的AIGC数字内容生成平台,平台利用多模态技术,使用自有的版权内容,生成文字、音频、图片、视频等影视素材,进行内容的创作生产,正在内部试用中。

新华网新华智云的妙笔是AI文本生成,生花就是AI文生图,这两个今年上线的新产品都是AIGC内容生产工具。MAGIC有文生视频的功能,目前也在尝试提升视频生成效果,通过内部测试后将对外发布。


温馨提醒:用户在赢家聊吧发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。本文中出现任何联系方式与本站无关,谨防个人信息,财产资金安全。
点赞10
发表评论
输入昵称或选择经常@的人
聊吧群聊

添加群

请输入验证信息:

你的加群请求已发送,请等候群主/管理员验证。

时价预警 查看详情>
  • 江恩支撑:20.63
  • 江恩阻力:23.21
  • 时间窗口:2024-06-30

数据来自赢家江恩软件>>

本吧详情
吧 主:

虚位以待

副吧主:

暂无

会 员:

88人关注了该股票

功 能:
知识问答 查看详情>