作者 | 黄昱 编辑 | 周智宇
导读:年初,文生视频模型Sora的出现,掀起了全球竞逐AI视频生成的热潮。12月3日,腾讯混元大模型正式上线视频生成能力,成为业内首个开源视频生成大模型。
在文生文、文生图、3D生成之后,腾讯混元大模型又发布了一项新功能——视频生成。腾讯混元视频生成几乎没有门槛,用户只需要输入一段文字描述,腾讯混元生成视频大模型就可以生成一段五秒的视频。
目前,腾讯混元生成视频主要呈现四大特点:写实画质、语义遵从待探索
自两年前ChatGPT掀起的AI大模型热潮以来,大语言模型技术路径已收敛,而视频生成模型仍处于探索期。东方证券分析师指出,目前多模态技术方面没有一家公司处于绝对领先地位,技术路径仍存在探索的可能。
作为多模态生成中难度最大的领域,视频生成对算力、数据等资源要求较高,目前相较于文本、图像成熟度更低,同时面临商业化、产品化进展较慢的挑战。
尽管如此,为了更快抢占市场,去年十一月以来,视频生成领域的成果密集落地。国内外不少大模型厂商都实现了类Sora产品落地,包括国内MiniMax、智谱等。
腾讯混元大模型的加入,将进一步推动视频生成领域的竞争。未来,随着技术的发展和生态的完善,视频生成有望成为AI落地应用的重要领域。
本文地址:http://dy.qianwe.com/article/3517.html
上一篇:新王比亚迪的烦恼市场竞争日益激烈...
下一篇:未来五年不年三十别惊讶...