英伟达揭幕Nemotron-4架构，引领全球AI大模型技术新浪潮！_中银持续增长混合A(of163803)股吧

股吧首页 > 中银持续增长混合A吧 > 正文

最近访问：

中银持续增长混合A吧

返回中银持续增长混合A吧>>

- 重要股东股权质押数据全览

股友8O0338a102

发表于 2024-06-15 21:59:24 股吧网页版发布于四川

英伟达揭幕Nemotron-4架构，引领全球AI大模型技术新浪潮！

英伟达揭幕Nemotron-4架构，引领全球AI大模型技术新浪潮！

金牛论市　2024-06-15 20:17

　　6月15日，英伟达隆重推出革命性的AI模型Nemotron-4 340B，这一举动在Mixture of Experts（MoE）架构的应用上迈出了一大步，同时融入了RoPE优化算法：

　　架构革新：Nemotron-4 340B采用了Transformer框架，配备了因果注意力掩码，融合了旋转位置嵌入（RoPE）、SentencePiece分词器、MLP层中的平方ReLU激活函数等多重优化功能；

　　训练环境：该模型在由768个DGX H100节点组成的集群上进行了训练，每个节点配置有8个基于NVIDIA Hopper架构的H100 80GB SXM5 GPU；节点内部的GPU通过NVLink和NV Switch相连，实现了高达900Gb/s（双向各450Gb/s）的带宽；每个节点还装备了8个NVIDIA Mellanox 400G HDR IB主机通道适配器，以促进节点间的通信；

　　性能亮点：Nemotron-4 340B在常识推理任务及如BBH等主流基准测试中创造了准确率的新纪录，同时在MMLU编码基准测试中也展现出了卓越的竞争力；

　　分析：与传统的Transformer模型相比，MoE架构提供了更高效的性能和更低的成本。随着全球科技巨头如谷歌和英伟达在其AI模型中积极推动MoE架构，这种设计正迅速成为AI模型开发的主流趋势，进而推动对先进网络设备的需求。这将导致对高性能交换机的需求增加，促使交换机峰值速率和总体需求量上升。AI计算基础设施的持续扩展将带动上游光学模块、交换机等组件的需求增长。

　　建议关注的行业与企业：

　　交换机：锐捷网络、盛科通信、紫光股份、菲菱科思、共进股份；

　　光学模块及组件：中际旭创、天孚通信、新易盛；

　　光学芯片：源杰科技。

郑重声明：用户在社区发表的所有信息将由本网站记录保存，仅代表作者个人观点，与本网站立场无关，不对您构成任何投资建议，据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容，远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息，谨防上当受骗！

评论该主题

帖子不见了！怎么办？

作者：您目前是匿名发表登录 | 5秒注册作者：，欢迎留言退出发表新主题

温馨提示： 1.根据《证券法》规定，禁止编造、传播虚假信息或者误导性信息，扰乱证券市场；2.用户在本社区发表的所有资料、言论等仅代表个人观点，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决定证券投资并承担相应风险。《东方财富社区管理规定》