AI时代CPU不老！Intel五代至强五大革新：340亿参数小意思

AI漫长的历史中，ChatGPT绝对是浓墨重彩的一笔。正是它引爆了AI大模型概念，也让以往高高在上的AI飞入了寻常百姓家，开始融入每个人的日常工作、生活，AI PC、AI手机、AI边缘也都在大踏步前进，变革千行百业。

有调研数据显示，预计到2026年，AIGC相关投入将超过3000亿美元，到2028年，80％以上的PC都会转换成AI PC，而在边缘应用中AI的普及率也将超过50％。

AI大模型等应用最需要的当然是高算力，GPU加速器随之变得炙手可热，但是AI的发展与变革同样是多元化的，CPU通用处理器、NPU神经网络引擎也都在各司其职，贡献自己的力量。

尤其是传统的CPU，也在紧跟时代的脚步，全方位拥抱AI，Inte第五代至强(Emerald Rapids)就是一个典型代表。

Intel 2023年初发布的第四代至强(Sapphire Rapids)，年底就升级为第五代，速度之快前所未有，主要就是为了跟上形势，尤其是AI的需求，很多指标都是为此而优化的。

这包括更多的核心数量、更高的频率、更丰富的AI加速器，都带来了性能和能效的提升，对于AIGC非常有利。

还有多达3倍的三级缓存，可以减少对系统内存的依赖，内存带宽也同时进一步提升。

软件生态方面，Intel提供了全方位的开发支持与优化，尤其加大了对主流大模型、AI框架的支持，特别是PyTorch、TensorFlow等等，在AI训练、实时推理、批量推理等方面，基于不同算法，性能提升最多可达40％，甚至可以处理340亿参数的大模型。

根据Intel提供的数据，五代至强SPECInt整数计算性能提升21％，AI负载性能提升最多达42％，综合能效也提升了多达36％。

具体到细分领域，图像分割、图像分类AI推理性能提升最多分别42％、24％，建模和模拟HPC性能提升最多42％，网络安全应用性能提升最多69％。

网络与云原生负载能效提升最多33％，基础设施与存储负载能效提升最多24％。

有趣的是，Intel指出五代至强也有很高的性价比，其中一个评估标准就是同时支持的用户数，五代至强可以在BF16、INT8精度下同时满足8个用户的实时访问需求，延迟不超过100ms。

五代至强的优秀，也得到了合作伙伴的验证，比如阿里云、百度云都验证了五代至强运行Llama 2 700亿参数大模型的推理，其中百度云在四节点服务器上的结果仅为87.5毫秒。

再比如京东云，Llama 2 130亿参数模型在五代至强上的性能比上代提升了多达50％。

接下来，Intel至强路线图推进的速度同样飞快，今年内会陆续交付Granite Rapids、Sierra Forest两套平台，均升级为全新的Intel 3制程工艺。

其中，Sierra Forest首次采用E核架构，单芯片最多144核心，双芯整合封装能做到288核心，今年上半年就能问世。

Sierra Forest主要面向新兴的云原生设计，可提供极致的每瓦性能，符合国家对设备淘汰换新的要求，而且因为内核比较精简，可以大大提高同等空间内的核心数量。

紧随其后的Granite Rapids，则依然是传统P核设计，具备更高频率、更高性能。

Granite Rapids针对主流和复杂的数据中心应用进行优化，尤其是大型程序，可以减少对虚拟机的依赖。

到了2025年，Intel还会带来再下一代的至强产品，代号Clearwater Forest，无论制程工艺还是技术特性抑或性能能效，都会再次飞跃。

干货教程更多>>