处理器大厂英特尔於 Hot Chips 2024 发表从资料中心、云端和网路,到边缘和 PC 等各种 AI 应用场景的最新进展,展现其技术的深度与广度。
英特尔这次发表的新产品包括用於高速 AI 资料处理的首款全面整合光学运算互连(optical compute interconnect,OCI)小晶片。英特尔也公布预计於 2025 年上半年推出的Intel Xeon 6 SoC(代号Granite Rapids-D)最新细节。
首先、英特尔院士暨网路与边缘运算晶片设计工程师 Praveen Mosur 说明 Intel Xeon 6 系统单晶片(System-on-Chip,SoC)设计的新细节,以及它如何克服不稳定网路连接以及有限空间和功率等边缘应用情境中出现的挑战。
其藉由全球超过 9 万次边缘布署所累积的知识经验,这款 SoC 将成为英特尔目前为止最符合边缘应用的最佳化处理器。从边缘装置扩展到边缘节点,透过单系统架构和整合的 AI 加速功能,企业能更轻松、更有效率、更保密地管理从资料撷取到推论的完整 AI 工作流程,有助於改善决策、提升自动化程度,为客户创造价值。
英特尔强调,Intel Xeon 6 SoC 结合 Intel Xeon 6 处理器的运算小晶片以及基於 Intel 4 处理技术打造的边缘最佳化 I/O 小晶片,使这款 SoC 的效能、能耗效率和电晶体密度与先前相比都有显着改善。另外,Intel Xeon 6 SoC 特色还包括32个通道的 PCI Express(PCIe)5.0、16 个通道的 Compute Express Link(CXL)2.0、双埠 100G 乙太网路、4 个和 8 个记忆体通道,采用相容的 BGA 封装、以及强化边缘应用的功能,包括扩大工作负载温度范围和提升工业级可靠度,成为高效能强固型装置的理想选择。
英特尔表示,Intel Xeon 6 SoC 还有专为提高边缘和网路工作负载效能和效率的设计,包括新媒体加速,强化即时 OTT、VOD 和广播媒体的视讯转码和分析能力,提高推论效能的 Intel Advanced Vector Extensions 和 Intel Advanced Matrix Extensions,可达成更有效率网路和储存效能的 Intel QuickAssist 技术,降低虚拟化 RAN 功耗的 Intel vRAN Boost。此外,还支援 Intel Tiber Edge Platform,使用者可利用此平台在标准硬体上进行如云端般简易的建构、布署、执行、管理并扩充边缘和 AI 解决方案。
英特尔客户端 CPU SoC 资深设计工程师 Arik Gihon 探讨了 Lunar Lake 客户端处理器,以及其设计如何提升 x86 处理器的能耗效率,并提供领先的核心、绘图处理与客户端AI效能。全新 P-core 和 E-core 有着惊人的效能,与上一代产品相比,系统单晶片功耗可降低高达 40%。新的神经元处理单元(Neural Processing Unit,NPU)速度最多可提升 4 倍,执行生成式 AI 任务的表现优於上一代产品。此外,新的 Xe2 GPU 核心也将游戏和绘图效能提高到上一代的 1.5 倍。Lunar Lake 的更多详细资讯将在 9 月 3 日的 Intel Core Ultra 发表会中分享。
至於,英特尔 AI 加速器首席设计工程师 Roman Kaplan 也介绍了需要大量运算能力的生成式 AI 模型训练和部署。随着系统从单节点扩充到数千个节点的大型丛集,也带来了巨大的成本和能耗挑战。
Intel Gaudi 3 AI 加速器运用最佳化的架构改善运算、记忆体和网路架构,解决了上述的问题;透过采用高效率的矩阵乘法引擎(Matrix Multiplication Engines ,MME)、双阶层(two-level)快取整合和广泛的 RoCE(RDMA over Converged Ethernet)网路通讯等策略,Gaudi 3 A I加速器能够实现显着的效能和能耗效率表现,使AI资料中心的运作更具成本效益与永续性,解决布署生成式 AI 工作负载时的可扩充性问题。Gaudi 3 AI 加速器和未来 Intel Xeon 6 产品的相关资讯将在 9 月的发表会中分享。
最後,英特尔整合光学解决方案(Integrated Photonics Solutions,IPS)事业部展示业界最先进的首款全面整合光学运算互连(OCI)小晶片,能与英特尔 CPU 共同封装并处理即时资料。
英特尔工程师暨光学整合(Photonics Integration)负责人 Saeed Fathololoumi 介绍了 OCI 小晶片,其设计可在长达 100 公尺的光纤上双向支援 64 个通道、32 Gbps 资料传输。 Fathololoumi 也说明了 OCI 小晶片如何满足 AI 基础设施对更高频宽、更低功耗和更大覆盖范围日益增加的需求。英特尔的 OCI 小晶片使高频宽互连获得重大进展,可实现未来 CPU/GPU 丛集连接的可扩充性和新式运算架构,包括资料中心和高效能运算(HPC)应用的新兴 AI 基础设施,也可达到一致的记忆体扩充和资源分散。
(首图来源:英特尔)