英伟达算力称霸暗线:交换机赛道热战
菲菱科思资讯
2024-06-07 09:01:53
  • 22
  • 22
  •   ♥  收藏
  • A
    分享到:
来源:21世纪经济报道

  随着英伟达的市值持续创下新高,华尔街开始出现一种新的担忧——“警惕成为下一个思科”。

  在互联网时代发展的初期,思科作为全球网络设备龙头而备受热捧,即便此后经历了股价飞升又暴跌,但至今,其依然在核心交换机市场占据优势份额。

  身处智能计算加速时代的当下,英伟达和思科的交集不仅限于不同时代华尔街的“当红炸子鸡”,还源于在交换机赛道的竞速发展。

  2019年,英伟达宣布以69亿美元收购以色列芯片厂商Mellanox,后者的优势产品在于InfiniBand(以下简称“IB”)和以太网交换机等,这成为助推英伟达今天GPU霸主地位的一个重要后盾:数据中心部署离不开算力、存储、通信连接,交换机就是“连接”功能中的重要产品。

  在今年3月的英伟达GTC(GPU技术大会)上,公司发布专为大规模AI量身订制的全新网络交换机“X800系列”,其中就包括NVIDIA Quantum-X800 InfiniBand网络和NVIDIA Spectrum-X800以太网络两种路线对应的产品。

  眼看着英伟达在构建加速计算解决方案的道路上越走越远,竞争者也在蓄力。

  2023年7月,超以太网联盟(Ultra Ethernet Consortium,简称UEC)成立,其中成员包括AMD、Arista、博通、思科、Meta和微软等,旨在解决以太网实际应用过程中的诸多不足。

  在数据中心尤其是智算中心加速部署的当下,交换机重要性提升也引发华尔街新的关注。

  考虑到Mellanox已被英伟达收购,二级市场开始重视第三方交换机市场的另一重要标的——Arista。巧合的是,这家公司和思科都是UEC成员。

  21世纪经济报道记者观察发现,Arista的股价约在2022年与2023年之交开始快速攀升,时间节点正契合了ChatGPT的发布,也与英伟达的股价飞升转折点接近。

  这显示出算力网络构建过程中不可忽视的一条暗线:以太网交换机和IB交换机之争。

  交换机大热

  作为重要的算力基础设施,交换机到底是什么?

  Omdia数据中心IT团队首席分析师Manoj Sukumaran对21世纪经济报道记者分析道,随着越来越多的人工智能计算能力在建立,对网络的需求也显著增加。

  运行人工智能训练工作负载的服务器被聚集在一起,形成一个大型的高性能计算系统或分布式系统,大语言模型在这些系统中进行训练。

  这需要在这些系统之间拥有一个高容量、低延迟的网络。高带宽交换机和网络接口卡正是被用于互连服务器以形成人工智能集群。

  据IDC统计,目前全球Top级别交换机厂商包括思科、华为、Arista、HPE等,当然按照应用市场不同,这些厂商面向下游有各自优势。

  由此可见,随着全球主流经济体在加速推进智算中心部署,厂商之间竞争态势可能存在一定变数。

  至于具体厂商变化,IDC数据显示,2023年思科非数据中心(Non-DC)收入占以太网交换机总收入的69.5%,全年同比增长28.6%;数据中心(DC)收入占剩余部分,全年增长了9.7%;思科2023年以太网交换机市场份额为43.7%。Arista的以太网交换机收入中,91.4%来自数据中心,年增速35.2%;公司全年市场份额11.1%。华为的以太网交换机总收入在2023年增长了10.6%,全年其全球市场份额达9.4%。

  国内多家上市公司也在积极参与市场发展。记者梳理财报发现,2023财年,中兴通讯(000063.SZ)推出9900X系列数据中心交换机,核心器件已实现全自研,在国内运营商集采项目的中标份额显著提升。

  菲菱科思(301191.SZ)财报显示,2023年已具备100G/400G数据中心主流的接口速率、高带宽、大容量交换机的硬件开发能力,报告期内2.0T/8.0T数据中心交换机形成量产交付,12.8T等其他数据中心交换机也在稳步小批量验证中。

  共进股份(603118.SH)2023年国内客户400G数据中心交换机已实现批量出货,突破重点客户800G高阶交换机项目。锐捷网络在去年推出业界首台支持LPO(线性可插拔光模块)的51.2T数据中心交换机,以及采用直驱系统设计的800G交换机技术方案,规模交付200G/400G数据中心交换机。

  中兴通讯承载网副总经理李新双对21世纪经济报道记者分析道,近年来,交换机市场确实展现出了蓬勃的增长态势和快速的技术迭代。随着各大运营商、云服务提供商、互联网厂商在数据中心的投资持续增加,交换机作为网络核心设备,正迎来重大发展机遇。

  “我们可以预见在AI大模型驱动下,具备高性能、高可靠、低功耗、低延时、0丢包特点的交换机将迎来快速发展机遇。”他进一步分析,随着大模型的广泛应用和网络技术的不断进步,交换机在算力互联、数据传输方面的价值将进一步提升,促进数据中心交换机市场空间持续增长。

  从应用趋势看,李新双指出,目前200G/400G交换机需求显著增长,800G交换机也逐步出现。但当前智算网络的发展仍处于初级阶段,GPU部署仍以200G/400G为主,因此在短期内,200G/400G交换机仍是主流需求,800G可能会用于交换机内部互联场景。预计随着GPU能力提升,届时800G交换机有望获得更广泛的应用。

  Manoj Sukumaran也对记者分析,“目前,400GE交换机和200GE交换机被广泛使用,向800GE交换机和400GE以太网适配器的迁移已经开始。Infiniband(IB)是最受欢迎的通信协议,但现在随着RoCE v3的支持,以太网也开始从Infiniband手中抢占市场份额。”

  大模型拉动

  按照应用市场不同,以太网交换机主要可以被分为数据中心交换机、非数据中心交换机。两大类市场随着大模型等新技术所驱动,可能将在未来呈现不同发展速度。

  IDC统计显示,2023年全球数据中心(DC)部分的市场收入同比增长13.6%,数据中心以太网交换机占据整个市场总收入的41.5%;其余部分为非数据中心部分。

  IDC中国研究经理王子剑对21世纪经济报道记者表示,未来交换机厂商的核心竞争场景有可能会集中在数据中心交换机市场。“当前云计算、大数据的快速发展,以及最近AI的火爆,成为持续推动数据中心交换机市场快速发展的主要因素。同时,在国家层面也不断推出产业政策鼓励和支持信息化建设,特别是‘互联网+’和新基建等,对数据中心行业提供了发展机遇。根据IDC预测,预计到2025年数据中心交换机占比将接近50%,2026年开始占比将超过园区交换机市场。”

  数据中心的加速建设背后,也意味着对数据传输带宽提出更高诉求。头豹研究院分析师常乔雨则对21世纪经济报道记者表示,交换机市场向更大带宽发展是一个必然趋势。随着5G和AI高速发展,数据传输的体量、质量和速度要求都愈来愈高,势必需要更高更快的传输带宽。

  “当前200/400G的华为、新华三交换机产品已经在高速率场景下大范围普及。未来随着AI进一步发展,对于高性能计算集群和需求的不断增长,200/400G的产品会遇到一定性能瓶颈,将会对800G的产品产生进一步需求,华为也在2023年提出800G的产品以对未来市场需求做出提前战略布局。我们预计800G的交换机产品有望在三年内实现快速大规模商业化落地。”其续称。

  王子剑也对记者表示,根据IDC对中国市场的统计,2023年200G/400G速率成为部署增速最快的产品,占比达8%,市场营收同比增长接近70%。AIGC的爆发以及人工智能领域各行业应用的不断探索和深入,预计2024年200G/400G交换机在国内会成为主流产品,尤其在互联网和头部科技企业的需求会更明显。

  “当前各主流厂商已经推出800G数据中心交换机产品,预计2024年会有小批量测试应用。随着AI技术的快速发展,特别是在AI大模型等应用场景下,对于高性能、高带宽交换机的需求将进一步提升,可以预见800G交换机在中国市场的应用将会快速增长。”他续称。

  AI加速发展可能也会一定程度影响到厂商的产品迭代部署。李新双对21世纪经济报道记者分析,技术趋势方面,“在AI智算的驱动下,交换机市场正经历着‘单端口带宽提升’‘端到端协同’‘水线调优’等一系列技术创新,对芯片、板卡、设备、算法等各个方面都提出了新的挑战。只有具备强大自研能力的设备商才能在激烈的市场竞争中脱颖而出”。

  对于具体应用市场,“据IDC统计,近两年中兴通讯数据中心交换机国内市场份额和市场收入增速明显提升。中兴已经在国内运营商网络云、公有云、私有云等新增市场项目中取得显著成果,同时在互联网、金融等行业逐步实现了突破。”他指出,中兴的策略是多元化发展,“在数据中心交换机领域,2022年在中国区市场实现发货增速第一,2023年实现收入增速第一;同时已经拥有一系列园区核心、汇聚、接入交换机产品。”

  技术路线竞赛

  前文主要提到以太网交换机发展,而其竞争对手IB(InfiniBand)交换机,实际上主导厂商只有英伟达(收购的Mellanox公司)和英特尔(收购的Qlogic公司)。

  与英伟达此前发展过程中借助CUDA和NVLink构建强悍的闭环生态类似,在网络传输方面,英伟达借助Mellanox公司构建起相对私有的InfiniBand网络生态。其优势在于更适合高性能计算的能力需求,缺点是成本偏高。

  Manoj Sukumaran对21世纪经济报道记者分析,InfiniBand现在确实有优势。“目前大多数AI集群都部署了InfiniBand网络,这是因为其低延迟、拥塞控制机制等特性。尽管InfiniBand在AI训练集群中很受欢迎,但AI推理服务器通常通过以太网与主网络互连。随着推理能力成为AI工作负载的更大一部分,大多数AI推理服务器都将通过以太网连接。”

  他指出,此外随着这一趋势的发展,如UltraEthernet等联盟正在对以太网进行优化,以使其也适合AI训练集群。“我们预计从2025年底或2026年开始,以太网标准的增强将解决AI集群扩展问题。从那时起,以太网将在AI训练集群中获得更多应用,并将成为InfiniBand的有力竞争者。”

  华夏基金也认为,以太网具备通用性和硬件部署经济性,在短期与InfiniBand有望形成抗衡,并随着丰富生态中参与者的合作迭代,在长期胜出;以太网生态中的头部供应商未来有望受益于AI催化下的硬件扩容和以太网占有率提升的双重利好因素。

  在以太网交换机方面,新的技术路线也在积极应用。李新双对记者分析,随着云计算市场蓬勃发展和大规模数据中心建设加速,对于更高效、更节能的数据处理与传输技术的需求日益凸显。这一背景下,白盒交换机、液冷交换机及CPO硅光技术等新技术方向备受行业关注。

  “就白盒交换机而言,随着数据中心建设持续推进,其在互联网行业商用已初具规模,并展现出进一步加速趋势。中兴通讯已经拥有成熟的白盒交换机产品,并陆续开始商用落地。”他进而分析,液冷技术已经发展至相对成熟的阶段。“我们已推出支持液冷技术的交换机。未来随着技术进一步发展和市场广泛接受,液冷交换机将在数据中心领域发挥更大作用,为数据处理提供更加高效、稳定的支持。”

  至于CPO技术是一种创新的数据中心网络技术,“它具备大幅提高数据中心网络速度、带宽和密度的潜力,同时降低系统复杂度和成本。但目前,CPO技术的商用进程受到成熟度、成本以及客户需求等多方面因素的影响。根据LightCounting预测,CPO出货量预计将从800G和1.6T端口开始,于2024至2025年开始试点。中兴作为光模块行业和数据中心交换机行业的重要参与者,将密切关注CPO技术的研发进展和商用进程,并积极准备在CPO硅光技术的商用化道路上发挥关键作用。”李新双表示。

  常乔雨对记者指出,国内与国外在白盒交换机和液冷交换机的技术差异不大,国内在性能实现上已达国际领先水平。“目前白盒已经得到一定采用,国内互联网巨头早期成立了SIP项目,在促进白盒生态发展的前提下,也在向客户推相关产品。尤其软硬件解耦方面,是当前众多大型央国企会去拓展的方向,以更好进行自主化与产品利旧。液冷技术与CPO硅光的想象空间较大,能够极大程度缓解和解决当前光模块功耗巨大的问题,也能更好地满足绿色数据中心的建设标准,但当前建设成本还是过高,未来还需要通过产业链整合或技术突破发力,以成本优势来实现大规模覆盖。”

  在多种技术和生态竞速的当下,常乔雨认为,新一批AI驱动的交换机会迎来较大发展,具备支持高性能计算网络、无损以太网(RoCE)、多元可靠联接、场景化网络调优等与AI性能更加匹配的交换机将会迎来快速发展机遇。

  王子剑则对记者分析,随着新技术推动、智算中心迭代升级,加上市场竞争加剧及客户需求变化,确实有可能催化厂商竞争格局改变。“当前交换机市场竞争比较激烈,品牌、价格、技术和解决方案的竞争无时无刻在考验厂商综合实力,客户数字化转型和智能化升级的需求也在不断变化,厂商不仅需要提供高性能、高可靠的产品,也需要灵活应对客户需求并提供满足其特定应用场景的解决方案,如此方能在未来竞争中拼出一席之地。”

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500