• 最近访问:
发表于 2024-04-01 11:38:42 股吧网页版 发布于 甘肃
计算机行业:Sora对算力需求影响几何?

计算机行业:Sora对算力需求影响几何?

 2024年04月01日 中国银河 吴砚靖,胡天昊 

  核心观点:

  Sora算力需求将呈指数级增长,带动算力基础设施需求。北京时间2月16日凌晨,OpenAI发布了首个文生视频模型Sora,可以用文字指令生成长达60秒的高清流畅视频,在生成视频长度、连贯性、多镜头切换方面具备显著优势。本文基于大语言模型推导算力需求方法,对Sora单次训练算力需求进行推演,据相关研究推测,Sora参数规模估算在30B(待确认),如果按此参数测算,我们推演出Sora训练单次算力需求或可达到2.6×10^24Flops,相当于GPT-3175B的8.2倍。我们认为,目前Sora还在初级阶段,仍然存在如能以准确模拟物理运动规律及场景、混淆左右方向、混淆空间细节等,但伴随Sora不断迭代调优,训练数据集规模增大,未来算力需求将呈现指数级爆发式增长,持续看好上游算力基础设施投资机会。

  Sora基于DiT架构,采用Transformer替换U-Net。Sora实际上是一种基于DiT(Diffusion Transformer,扩散变换器)的模型搭建,同时采用了Diffusion与Transformer,是一种用于扩散模型的新架构。Sora受到大语言模型的启发,用Transformer替换扩散模型中的U-Net,通过将Transformer与Diffusion结合成为一种基于扩散变换的模型DiT,趋于标准Transformer架构,同时保留其可扩展性。与大语言模型将文本转换为可被理解的token类似,Sora将视频转换成一系列Patch(视觉编码块)并将其进行降维,用Patch作为视觉图像统一表现形式,将噪声通过去噪来预测原始图像信息,进而生成视频。

  Sora实现跨越式提升,文生视频大模型开启新纪元。Sora可以将Prompt转换成长达60秒视频,相对于此前文生视频大模型Runway、Pika、Stable Video等提升几个级别。同时在视频分辨率以及质量方面,Sora可以生成1080P清晰度视频,并且能够相对完整实现对世界及物体运动规律理解及模拟,在镜头切换方面保持稳定性。此外,Sora还支持图片格式输入、视频扩展、视频拼接等,是文生视频领域突破性技术变革。

  投资建议:Sora是人工智能发展进程中的“里程碑”,推动AGI时代加速到来,算力需求将持续爆发,持续看好产业链投资机会。建议重点关注国内上市公司:

  1、国内多模态大模型:科大讯飞、海康威视、大华股份;

  2、算力基础设施:工业富联、中科曙光、软通动力、神州数码、华勤技术、曙光数创、润泽科技、拓维信息;

  3、AI应用端:万兴科技、金山办公、超图软件、彩讯股份、拓尔思、卫宁健康、嘉和美康等。

  风险提示:技术研发进度不及预期风险;供应链风险;政策推进不及预期风险;消费需求不及预期风险;行业竞争加剧风险等。

郑重声明:用户在基金吧/财富号/股吧等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
郑重声明:用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500