2018年12月19日,英特尔FPGA中国创新中心在重庆举办隆重揭幕仪式。该中心也是英特尔全球最大的FPGA创新中心。英特尔公司全球副总裁兼中国区总裁杨旭表示:“从CPU、GPU,到FPGA、ASIC,再到未来的神经拟态计算、量子计算等,英特尔正在全面布局未来的端到端计算创新,充分解锁数据的价值。”
当前,我们正迈向数据洪流的时代,这不仅意味着数据量的爆炸式增长,更体现在数据的形态和格式正发生着革命性的变化。然而,数据的处理方式也发生了端到端的延伸。没有任何一种技术能够同时解决所有问题。
面对技术更新迅速、迭代频繁的研发应用环境,FPGA(现场可编程门阵列)正成为越来越重要的芯片,它灵活高效、可重复编程特性,可实现定制性能、定制功耗、高吞吐量和低批量延迟,因此得到越来越广泛的应用,在泛人工智能、5G、无人驾驶、智能终端和数据中心等领域发挥重要作用。
近年来全球FPGA市场规模达到50-60亿美元。根据研调机构Global Market Insights的最新报告显示,FPGA市场在2015~2022年间将出现8.4%的年复合增长率,到2022年规模可望超过99.8亿美元。
受传统业务增长乏力影响,英特尔正在力图实现从传统芯片制造商向多元解决方案提供商转型。布局FPGA领域成为公司重点战略决策,通过与英特尔端到端的计算技术相结合,它可以更好的充分释放数据的巨大潜能。为此,英特尔2015年宣布完成对Altera的收购。此前, FPGA全球市场主要被Altera和Xilinx瓜分,合计占有近90%的市场份额,合计专利达到6000多项。
FPGA作为未来强大的计算加速器,不但影响主要企业的决策和市场趋势,而且加速企业中的工作负载,促进超大规模数据中心的内部搜索,提高HPC高性能计算模拟的地位。
在揭幕仪式上,英特尔还携手合作伙伴进行了FPGA在多个领域广泛应用的展示。比如,英特尔展示了面向数据中心应用的第二代FPGA计算卡——新一代Stratix 10 FPGA加速卡,可以带来了更高的内存容量和带宽。该芯片内建300亿颗晶体管,采用英特尔14nm工艺,比上一代产品性能提升3倍。新一代的加速卡还提供两个100 Gbps 的内联高速接口,带宽比上一代提升了2倍。
在过去的一年中,无论是产品技术的革新、还是行业合作的扩展,英特尔FPGA都取得了坚实的进展。
FPGA作为十分灵活且强大的计算加速器,可以为广大的创新创业公司打造软硬件结合的仿真验证平台,成为新一轮科技创新中十分重要的加速引擎。
此次,英特尔FPGA创新中心的成立,是英特尔目前为止全球最大的聚焦FPGA技术与生态的创新中心。被业内视为英特尔与中国合作伙伴共推智能应用落地和产业创新的又一里程碑。
“英特尔FPGA中国创新中心将成为英特尔在中国拓展和建设FPGA生态系统非常重要的载体。”英特尔可编程解决方案事业部副总裁兼工程设计总经理Ravishankar Kuppuswamy表示。
他介绍,助推中国FPGA生态建设,英特尔将打造“五个一工程”:从人才培育、项目孵化、应用展示、峰会大赛、产业聚集五个方面培育FPGA生态。
作为英特尔战略合作伙伴,戴尔易安信是英特尔FPGA创新中心服务器产品的独家赞助商,为创新中心提供了搭载FPGA的第14代PowerEdge系列服务器。
戴尔易安信全球资深副总裁、大中华区企业解决方案总经理曹志平表示,未来,FPGA将会成为越来越重要的芯片,CPU与FPGA深度融合的异构计算已成为产业发展的必然选择。CPU+FPGA的异构多核计算创新涉及软硬件等深层次融合创新,为赶超者提供了新的跑道。同时,CPU+FPGA的异构计算作为新的重要技术趋势,在加速了计算架构融合的同时,也给下游整机系统及软件开发带来了重要的机遇。
戴尔易安信与英特尔的结合,可以将FPGA技术的优势带入各种规模的数据中心,加速处理数据中心日益增长的数据。
数据中心计算加速领域,由于计算任务灵活多变、多租户等应用特性,传统的ASIC大规模神经网络部署,在研发成本、交付周期等方面已现颓势。FPGA在此应用环境中只需几百毫秒,即可完成逻辑功能更新,其灵活性可以大力保护数据中心的投资,并且始终保持数据中心同构性。在数据中心应用中,FPGA相比GPU的核心优势在于延迟:FPGA同时拥有流水线并行和数据并行两种方式,而GPU几乎只有数据并行(流水线深度受限)。当任务逐个而非成批到达时,流水线并行比数据并行可实现更低延迟。可见,针对流式计算的任务,FPGA在延迟方面比GPU具有天生优势,更符合未来数据中心的业务需要。
FPGA还被大量用于大型云数据中心实现人工智能应用。比如,现场金山云展示了基于FPGA技术的图像及视频智能鉴黄系统A10/AI(mobilenet),能精准识别视频及图像是否涉黄,模型准确度: 99.5%;通过FPGA的流水线结构设计,大幅提升计算效率,同时处理更大的并发请求,每秒处理能力为:769张(原始任意大小图片输入), 1052张(制定大小图片输入)。
在深度学习中,FPGA的灵活性可以很好地适应经常要调整算法的需求。地平线机器人则展示了使用Intel Arria 10技术,搭建了自动驾驶开放式计算平台Matrix,能够为L3、L4级别自动驾驶提供高性能的感知系统。每块Matrix可同时接入4路720P视频输入,实时处理速度>50fps,每块Matrix的功率仅为31W。目前,Matrix已向世界自动驾驶大厂大规模供货。
此外,展厅里还展示了在工业、大数据和云、视频、5G通讯、无人驾驶、人工智能等领域,基于英特尔FPGA技术的白多件应用案例。
(文章来源:经济观察网)