自研Arm CPU 谷歌造芯突围
谷歌-A资讯
2024-04-13 07:13:30
  • 点赞
  • 评论
  •   ♥  收藏
  • A
    分享到:
来源:中国经营网

K图 GOOGL_0

K图 GOOG_0

  就在英特尔推出最新AI芯片产品Gaudi 3加速卡来硬杠英伟达、AMD的同一天,谷歌也祭出了首款为数据中心设计、基于Arm架构定制的新型CPU Axion,谷歌造芯系列最新的一集来了。

  美国当地时间4月9日,科技巨头谷歌在云年度大会Google Cloud Next 24上宣布了Axion的存在,并表示Axion性能比通用ARM芯片高30%,比英特尔生产的当前一代X86架构芯片性能高50%,且能效高出60%。

  “基于Arm架构的芯片一般都能达到高能源效率,所以不是很出奇,而更好的性能则见仁见智,因为计算性能的评估需要考虑工作类型。”研究机构Omdia AI行业首席分析师苏廉节对《中国经营报》记者表示。

  对于此番谷歌自研CPU这件事,苏廉节并不感到意外:“云大厂都在走这条路,华为的鲲鹏和阿里的玄铁就是最好例子。”需要指出的是,玄铁采用的是另一种非X86架构——RISC-V架构。

  尽管当前数据中心CP市场相对稳定,但苏廉节认为目前的芯片大厂不该掉以轻心,来自云大厂的订单或许会下降,预计到2030年云厂商自研CPU会占据整体CPU出货量的20%。而投资机构ARK invest的预测更为激进:到2030年,在云业务领域取代X86架构,Arm+RISC-V的组合所占据的市场份额将增加至71%。

  首款Arm架构CPU

  公开资料显示,谷歌造芯之路是这样的:自2015年以来,谷歌推出专用芯片张量处理单元(TPU),迄今已发布了五代;2018年,谷歌发布了第一个视频编码单元(VCU);2021年,谷歌通过投资“片上系统”(SoC)设计,加大了定制计算的投入,并发布了用于移动设备的三代Tensor芯片中的第一款。

  而Axion则是谷歌自研芯片家族的最新成员,其基于Arm的Neoverse 2,专为数据中心设计。根据谷歌云内部的数据,与当今云中最快的、基于Arm的处理器相比,Axion提供的实例性能高出了30%;而与当代基于X86的同类处理器相比,Axion的性能高出50%,能效高出60%。

  需要指出的是,在此次Google Cloud Next 24大会上,谷歌还推出最新的TPU:TPU v5p,用于训练和推理的AI加速器,官方宣称其计算能力是上一代的4倍。据悉,谷歌的TPU是少数英伟达先进AI芯片的替代品之一,而开发者只能通过谷歌的云平台使用,不能直接购买。博通是谷歌生产前几代TPU芯片的合作方,谷歌并未透露设计Axion是否有合作方,以及博通参与推出谷歌云第五代TPU v5p的情况。

  Axion的推出,也意味着谷歌成为继微软和亚马逊之后第三家用基于Arm架构推出CPU的云厂商巨头。2018年,亚马逊的AWS推出了基于Arm的Graviton处理器;去年,微软推出了Cobalt 100,同样是Arm的架构。

  视线再转移到Axion身上。据悉,Axion适用于支持谷歌的搜索引擎和人工智能等一系列任务,将被用于多种谷歌旗下的服务,例如YouTube广告投放、大数据分析,将于今年晚些时候提供给Google Cloud客户使用。

  谷歌官方表示,Axion该芯片可以通过帮助处理大量数据并为数十亿名用户部署服务,将在AI领域发挥重要的支持作用。不过,谷歌并没有将该芯片视为一种竞争之举,谷歌负责自研芯片业务的副总裁Amin Vahdat说:“我觉得这是做大蛋糕的基础。”

  相关数据显示,虽然广告依然是谷歌最大收入源,但云计算的增长更快,在谷歌的收入中占比不断提高,已接近占公司总收入的11%。据市场研究公司Gartner估算,2022 年,谷歌占云基础设施市场7.5%的份额,而亚马逊和微软合计控制着约62%的市场份额。

  “X86 CPU的通用性很强,既能兼容前几代的系统,也能进行新型的应用,但正是由于兼容性的需求导致芯片无法进行彻底的优化,和新型的Arm芯片对比,某些性能还是欠缺。”苏廉节表示,云大厂都在自研CPU,所以英特尔、AMD等传统数据中心CPU芯片大厂不能掉以轻心。

  Arm+RISC-V的市场份额将超70%

  在去年Arm上市路演的视频中,英伟达CEO黄仁勋表示:“数据中心芯片将是驱动未来计算的重要力量,如果没有Arm芯片技术架构、没有高性能的Arm CPU支撑、没有Arm的IP授权系统,英伟达无法制造出超级AI芯片。”

  集邦咨询研究显示,近年企业对于人工智能、高效能运算等数字转型需求加速,带动云端采用比例增加,全球主要云端服务业者为提升服务弹性,陆续导入Arm架构服务器,预期至2025年Arm架构在数据中心服务器渗透率将达22%。

  那么,为什么Arm等非X86架构的CPU能在数据中心中分得市场?市场研究公司Counterpoint高级研究分析师 Akshara Bassi曾表示:“尽管英特尔仍然是市场领导者,但其市场份额的损失表明AMD不断增加的产品组合和优于英特尔的业绩。正如AWS和阿里巴巴所证明的那样,由于各种工作负载部署和Ampere Computing的现成解决方案提供的投资回报率,基于Arm的架构芯片继续获得发展势头。”

  事实上,蚕食X86架构的CPU市场份额,不只是Arm架构,还有开源的RISC-V架构。北京嘉楠捷思信息技术有限公司副总裁汤炜伟曾表示,一个新架构想渗透到一个原来的市场里面去,往往都是“从低向高”渗透的,但这个路线不适合RISC-V。

  “Arm是从C端向B端发展过程中渗透到X86市场的,server(服务器)最终使用者是B端,而PC(个人电脑)最终使用者是C端,C端的一个特点是软件需求非常多、使用非常友好,才能够得到广泛认可,体验足够好。”汤炜伟认为,RISC-V会优先渗透server而不是PC,由于server所使用的软件偏少,只要能在两三种软件取得优势,就能打开一定市场空间。

  记者还注意到,芯片大神Jim Keller加入的加拿大AI芯片独角兽Tenstorrent也在用RISC-V做CPU。Tenstorrent首席CPU架构师练维汉认为,AI模型的计算不只是矩阵型运算,还有很多需要CPU来做,比如大语言模型的存取非常破碎、混乱,而这是CPU最擅长做的。

  “大语言模型有所谓的KV cache,它是给语言模型的一个情景,比如说我谈狗的时候,是你的狗还是我的狗?所以说先把token(令牌)碰到KV cache里,它去找聊天记录,像这样的项目非常多,每次开始一个对话,它就做这样的事情。”练维汉表示,这是一种不同寻常的随机存取,所以CPU是个好选择,未来这样的情况预计会越来越多,所以CPU+AI引擎是一种好的异构组合。

  谈及为何选择RISC-V来做CPU,练维汉认为开源和灵活性是选择RISC-V的重要原因。“RISC-V是开源的,开源的好处是可以做任何修改;从整个计算需求的过程看,灵活性很重要,因为从客户端到云端有很多不同的优化,就需要指令集做灵活的改动。假如用Arm架构的话,任何事情都要和Arm汇报,获得授权。”练维汉表示,RISC-V是一个非常有灵活性的ISA(指令集架构),是一种计算的未来。

  根据ARK invest的预测,到2030年,Arm和RISC-V可能成为新的处理器标准,在云业务领域取代X86架构,Arm+RISC-V的组合所占据的市场份额,将从2020年的零,增加至2030年的71%。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500