谷歌AI视频模型深夜炸场：4K分辨率+2分钟时长又给OpenAI“来了一枪”_谷歌-A(usgoogl)股吧

股吧首页 > 谷歌-A吧 > 帖子正文

返回谷歌-A吧 >

谷歌AI视频模型深夜炸场：4K分辨率+2分钟时长又给OpenAI“来了一枪”

谷歌-A资讯

2024-12-17 13:28:00

14
4
♥ 收藏
A
大中小

分享到：

来源：科创板日报

　　Sora正式发布仅8天后，“谷歌版Sora”的2.0版本——Veo 2便正式发布。

　　据谷歌官网显示，Veo 2可制作具有逼真动作和高质量输出的视频。其最高分辨率可达4K，时长可达2分钟以上。谷歌方面表示，Veo代表着高质量视频生成领域的重大进步。

　　除视频清晰度有所长进外，Veo 2对物理世界和镜头控制的理解也是惊人的：

　　这段画面的部分提示词是：低角度跟踪拍摄，18mm镜头。汽车漂移，留下光迹和轮胎烟雾。相机低速跟踪，捕捉到光滑的橄榄绿色肌肉车接近拐角时的画面。

　　该画面部分提示词为：特写镜头聚焦于一位女DJ的脸部，她美丽、浓密的黑色卷发勾勒出她的五官。她闭上双眼，沉浸在节奏中，嘴角挂着一丝微笑。当她随着节拍点头和摇摆时，相机捕捉到了她头部的细微动作。

　　从上述案例可见，Veo 2在真实世界还原以及Prompt指令遵循方面都有不错的表现。而在谷歌官网发布的性能评估中，Veo 2同样打败了Sora Turbo、可灵、MiniMaX等一众海内外AI文生视频大模型。

　　对此，谷歌总结称，Veo 2在技术层面上的进步主要体现在三个方面。一是物理引擎的优化，这决定了AI视频模型对于现实世界物理规律的深入理解。二是摄影技术的集成，能够输出更为丰富的视觉效果。最后是人物表现力的提升，使人物动作和表情更具实感。

　　目前，Veo 2已被引入谷歌旗下视频创作工具VedioFX。就在上周，OpenAI正式推出Sora Turbo，向美国及其他市场的ChatGPT付费用户开放。新版工具Sora Turbo可以生成最长达20秒的视频，并且可以提供这些视频的多种变体。

　　与此同时，国内文生视频进展不断。今年以来，国内企业开始加速研发并迭代AI视频生成产品，产品能力不断提升：

　　今年6月，快手AI团队发布可灵AI视频生成大模型，可生成长达2分钟、分辨率达1080p的视频；

　　7月，智谱AI上线视频生成产品智谱清影，并在11月进行升级，支持生成时长为10秒的4K超高清视频；

　　8月，字节推出即梦AI一站式创作平台，随后在11月宣布即梦AI视频模型S2.0Pro和P2.0Pro上线。

　　山西证券12月12日研报指出，随着AI视频生成工具持续迭代，未来其向多种应用场景的渗透有望加速。一方面，应用层建议重点关注创意、设计、教育等多模态特别是视频生成强相关的领域；另一方面，视频生成模型对算力需求较文本显著提升，重点关注AI算力相关标的。

（文章来源：科创板日报） [点击查看原文]

郑重声明：用户在财富号/股吧/博客等社区发表的所有信息（包括但不限于文字、视频、音频、数据及图表）仅代表个人观点，与本网站立场无关，不对您构成任何投资建议，据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容，远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息，谨防上当受骗！