美国谷歌旗下的“深层思维”公司16日宣布,推出新一代人工智能视频生成模型Veo 2,在视频分辨率与图像质量以及模拟真实世界物理规律方面大幅提升。
该公司称,Veo 2可以创建4K分辨率、时长两分钟的视频,大幅领先美国开放人工智能研究中心(OpenAI)日前公布的最新视频生成模型Sora Turbo。据介绍,Veo 2能根据文本提示或参考图像生成视频,可以更真实地模拟运动、流体力学和光的特性,实现不同的镜头和电影效果,以及“细致入微”的人类表情。
“深层思维”公司产品副总裁柯林斯表示,在接下来的几个月里,公司将继续根据用户的反馈对产品进行迭代。他承认目前Veo 2仍有不足,该模型生成视频的“连贯性和一致性尚需改进”,在生成复杂细节、快速复杂动作以及突破现实局限方面也有进步空间。
公司还表示,为应对深度伪造的风险,将利用水印技术把隐形标记嵌入Veo 2生成的视频帧中。