英特尔的PonteVecchioXeHPCGPU拥有1000亿个晶体管

2021-07-19 10:01:45

导读英特尔在概述其涉及内部和外部制造能力的使用的IDM 2 0战略几个小时后，上传了其即将推出的用于超级计算机的 Ponte Vecchio Xe-HPC

英特尔在概述其涉及内部和外部制造能力的使用的IDM 2.0战略几个小时后，上传了其即将推出的用于超级计算机的 Ponte Vecchio Xe-HPC GPU 的详细描述。Ponte Vecchio 采用英特尔、三星和台积电生产的各种工艺技术生产的组件，以最好的方式展示了英特尔对未来的愿景。

英特尔代号为 Ponte Vecchio 的 GPU 是该公司首款基于 Xe-HPC 微架构的 GPU，最初将用于阿贡国家实验室的 Aurora 超级计算机以及英特尔的下一代至强可扩展“Sapphire Rapids”处理器。该机器将成为业界首批具有超过 1 ExaFLOPS FP64 性能的超级计算机之一。

随着时间的推移，该部件将提供给其他客户，英特尔甚至可能对其进行定制，因为 Ponte Vecchio 使用分解的模块化架构，这是英特尔处理复杂处理器的新方法，这相对容易。

事实上，不可能构建一个单片的 Ponte Vecchio，因为它是一个具有 47 个组件、超过 1000 亿个晶体管并提供 PetaFLOPS 级 AI 性能的大型处理器(稍后会详细介绍)。

Ponte Vecchio 包括以下瓷砖/小芯片：

2 块采用英特尔 10 纳米 SuperFin 技术制成的基础瓷砖

16 个计算块最初由台积电生产，然后由英特尔在其 7 纳米技术准备好进行大批量制造 (HVM) 时生产。

使用英特尔 10 纳米增强型 SuperFin 工艺制造的 8 个 Rambo 缓存块

11个英特尔制造的EMIB链接

2 个由代工厂制造的 Xe Link I/O 磁贴

DRAM 制造商生产的 8 个 HBM 内存堆栈

目前，英特尔仅在实验室中使用其 Ponte Vecchio Xe-HPC GPU。虽然该设备的模块化设计使公司能够或多或少地具有成本效益，但定制设计的散热、电压和频率很棘手，需要一些时间。

关于英特尔 Ponte Vecchio 描述的一件有趣的事情是，该芯片制造商表示它提供“PetaFLOPS 级 AI 性能”。有许多 AI 工作负载需要不同的计算精度。

英特尔通常认为 FP16 是 AI 的最佳精度，因此当该公司说其 Ponte Vecchio 是“手掌中的 PetaFLOP 级 AI 计算机”时，这可能意味着 GPU 具有大约 1 PFLOPS FP16 的性能或 1,000 TFLOPS FP16 性能。将数字放在上下文中，Nvidia 的 A100 计算 GPU 提供大约 312 TFLOPS FP16 性能。

阿贡国家实验室的 Aurora 超级计算机将于 2022 年交付使用。

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时候联系我们修改或删除，多谢

标签：英特尔

上一篇:GeForceRTX3080Ti据称延迟至5月中旬

下一篇:三星用HKMGDDR5芯片开发512GBDDR5模块

购团邦网

猜你喜欢

最新文章