英特尔的PonteVecchioXeHPCGPU拥有1000亿个晶体管

导读 英特尔 在概述其 涉及内部和外部制造能力的使用的IDM 2 0战略几个小时后,上传了其即将推出的用于超级计算机的 Ponte Vecchio Xe-HPC

英特尔 在概述其 涉及内部和外部制造能力的使用的IDM 2.0战略几个小时后,上传了其即将推出的用于超级计算机的 Ponte Vecchio Xe-HPC GPU 的详细 描述。Ponte Vecchio 采用英特尔、三星和台积电生产的各种工艺技术生产的组件,以最好的方式展示了英特尔对未来的愿景。

英特尔代号为 Ponte Vecchio 的 GPU 是该公司首款基于 Xe-HPC 微架构的 GPU,最初将用于阿贡国家实验室的 Aurora 超级计算机以及英特尔的下一代至强可扩展“Sapphire Rapids”处理器。该机器将成为业界首批具有超过 1 ExaFLOPS FP64 性能的超级计算机之一。

随着时间的推移,该部件将提供给其他客户,英特尔甚至可能对其进行定制,因为 Ponte Vecchio 使用分解的模块化架构,这是英特尔处理复杂处理器的新方法,这相对容易。

事实上,不可能构建一个单片的 Ponte Vecchio,因为它是一个具有 47 个组件、超过 1000 亿个晶体管并提供 PetaFLOPS 级 AI 性能的大型处理器(稍后会详细介绍)。

Ponte Vecchio 包括以下瓷砖/小芯片:

2 块采用英特尔 10 纳米 SuperFin 技术制成的基础瓷砖

16 个计算块最初由台积电生产,然后由英特尔在其 7 纳米技术 准备好进行大批量制造 (HVM) 时生产。

使用英特尔 10 纳米增强型 SuperFin 工艺制造的 8 个 Rambo 缓存块

11个英特尔制造的EMIB链接

2 个由代工厂制造的 Xe Link I/O 磁贴

DRAM 制造商生产的 8 个 HBM 内存堆栈

目前,英特尔仅在实验室中使用其 Ponte Vecchio Xe-HPC GPU。虽然该设备的模块化设计使公司能够或多或少地具有成本效益,但定制设计的散热、电压和频率很棘手,需要一些时间。

关于英特尔 Ponte Vecchio 描述的一件有趣的事情是,该芯片制造商表示它提供“PetaFLOPS 级 AI 性能”。有许多 AI 工作负载需要不同的计算精度。

英特尔通常认为 FP16 是 AI 的最佳精度,因此当该公司说其 Ponte Vecchio 是“手掌中的 PetaFLOP 级 AI 计算机”时,这可能意味着 GPU 具有大约 1 PFLOPS FP16 的性能或 1,000 TFLOPS FP16 性能。将数字放在上下文中,Nvidia 的 A100 计算 GPU 提供 大约 312 TFLOPS FP16 性能。

阿贡国家实验室的 Aurora 超级计算机将于 2022 年交付使用。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢