直接生成16秒高清视频我国自研视频大模型发布

来源：新华网作者：魏梦佳发布时间：2024-4-28 09:50 |

只需一段文字指令就能生成一段逼真视频，今年初，文生视频大模型Sora在全球人工智能业内外引发广泛关注。27日，2024中关村论坛年会上首次发布我国自研的具“长时长、高一致性、高动态性”特点的文生视频大模型Vidu。

记者从会上获悉，这一视频大模型由清华大学联合北京生数科技有限公司共同研发，可根据文本描述直接生成长达16秒、分辨率高达1080P的高清视频内容，不仅能模拟真实物理世界，还拥有丰富想象力。

清华大学人工智能研究院副院长、生数科技首席科学家朱军说，当前国内视频大模型的生成视频时长大多为4秒左右，Vidu则可实现一次性生成16秒的视频时长。同时，视频画面能保持连贯流畅，随着镜头移动，人物和场景在时间、空间中能保持高一致性。

在动态性方面，Vidu能生成复杂的动态镜头，不再局限于简单的推、拉、移等固定镜头，而是能在一段画面里实现远景、近景、中景、特写等不同镜头的切换，包括能直接生成长镜头、追焦、转场等效果。

“Vidu能模拟真实物理世界，生成细节复杂且符合物理规律的场景，例如合理的光影效果、细腻的人物表情等，还能创造出具有深度和复杂性的超现实主义内容。”朱军介绍，由于采用“一步到位”的生成方式，视频片段从头到尾连续生成，没有明显的插帧现象。

此外，Vidu还可生成如熊猫、龙等形象。

据悉，Vidu的技术突破源于团队在机器学习和多模态大模型方面的长期积累，其核心技术架构由团队早在2022年就提出并持续开展自主研发。“作为一款通用视觉模型，我们相信，Vidu未来能支持生成更加多样化、更长时长的视频内容，探索不同的生成任务，其灵活架构也将兼容更广泛的模态，进一步拓展多模态通用能力的边界。”朱军说。

（编辑：王星）

凡本网注明“来源：企业观察网”的所有作品，均为《企业观察报》社有限责任公司合法拥有版权或有权使用的作品，未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的，应在授权范围内使用，并注明“来源：企业观察网”。违反上述声明者，本网将追究其相关法律责任。凡本网注明“来源：XXX（非企业观察网）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如其他媒体、网站或个人转载使用，须保留本网注明的“稿件来源”，并自负法律责任。如因作品内容、版权和其它问题需要同本网联系的，请在相关作品刊发之日起30日内进行。联系方式：010-68719660。

今日看点下一页上一页 热点 透视2024年中国经济“半年报” 国资 山东省属企业首批“十大科创成果”发布 制造 回澜威士忌蒸馏厂正式落成投产 要闻 从三中全会公报读懂新一轮改革战略重点 地方 陕西：榆林加快建设世界一流高端能化基地 能源 台达杯国际太阳能建筑设计竞赛首次开展实地建设研学活动 数字化 “毛肚自由”背后锅圈正推动美食革命 央企 三大运营商央企哪家强？ 时评 离职证明不能让用人单位“任意打扮”


视觉 / 视频更多 党的二十届三中全会在京举行 国务院国资委：整治形式主义为基层减负 世界最长海底高铁隧道开始盾构掘进 “海葵一号”登船启运前往珠江口盆地 中国华能云南多能互补基地装机突破3000万千瓦 第七届中国企业改革发展峰会暨成果发布会召开
融媒体更多 从中国一重到哈电集团，刘轶挑战“三大动力厂” 岚图能否开启东风汽车新霸图 车企大佬争当直播网红，重写“英雄谱”还是空做“邯郸
时评更多 离职证明不能让用人单位“任意打扮” 当巴黎奥运遇到“中国制造” 从“双休”到“大小周”？放过打工人吧 暂停灯光秀，“照亮”民生之举 博物馆如何持续“热辣滚烫”

直接生成16秒高清视频我国自研视频大模型发布

在线客服

在线咨询

联系电话

热线电话

回到顶部

直接生成16秒高清视频 我国自研视频大模型发布

在线客服

在线咨询

联系电话

热线电话

回到顶部

直接生成16秒高清视频我国自研视频大模型发布