英特尔聚力整合实现可持续的异构计算

发布日期：2023-09-03 来源：半岛官网pg

随着我们进入E级(Exascale)计算时代并迈向Z级(Zettascale)计算时代，行业也慢慢变得影响着全球的碳排放。据估计，到2030年数据中心的能耗估计将达到全球能源产量的3%-7%①，而计算基础设施将成为新增用电量的主要驱动因素。

今年，英特尔承诺到2040年实现全球业务的温室气体净零排放，并开发更加可持续的技术解决方案。在创造可持续未来的同时满足对计算永无止境的需求，这是高性能计算(HPC)面临的最大挑战之一。这个任务虽然艰巨，但如果我们也可以把芯片、软件和系统这些HPC计算堆栈的每个部分都做好，它就应该实现的。

我在德国汉堡举行的2022国际超算大会(ISC2022)上发表了主题演讲，以上内容就是我在演讲中传达的核心信息。

英特尔公布了直到2024年的高性能计算产品路线图，期间我们将致力于提供多样化的异构架构。这些架构不仅将使我们也可以实现几个数量级的性能提升，同时亦可降低通用工作负载及诸如人工智能、加密、分析等新兴工作负载的能耗。

以内置高带宽内存(HBM)，代号为Sapphire Rapids的英特尔至强处理器为例，该款处理器能够很好地展示我们如何利用先进的封装技术和芯片创新，为高性能计算带来性能、带宽和节能方面的显著提升。通过封装高达64GB的高带宽内存HBM2e并把加速器集成到CPU中，我们也可以释放内存敏感型工作负载的潜力，为这些关键的高性能计算应用场景大幅度的提高性能。在对比第三代英特尔至强可扩展处理器和即将推出的内置高带宽内存(HBM)的Sapphire Rapids处理器时，我们得知，后者把气候研究、能源、制造和物理学工作负载的性能提升了2-3倍②。在主题演讲中，Ansys首席技术官Prith Banerjee还展示了内置高带宽内存的Sapphire Rapids为Ansys Fluent和ParSeNet的实际在做的工作负载带来了高达2倍的性能提升③。

为实现跨HPC和AI超算工作负载的几个数量级的性能提升，计算密度是另一必不可少的要素。代号为PonteVecchio的英特尔首个旗舰级数据中心图形处理器(GPU)，已经在复杂的金融服务应用以及AI推理和训练工作负载方面展现出了卓越的优势。

创新不止于此。今天，我们还宣布这款出色数据中心GPU的下一代产品代号为Rialto Bridge。通过升级Ponte Vecchio架构，并结合使用下一代制程节点技术制造的增强型芯片子模块，Rialto Bridge将大幅度提高计算密度、性能和效率，同时提供软件一致性。

展望未来，Falcon Shores是我们路线图中下一个重要的架构创新，即把x86 CPU和Xe GPU集成在同一插槽中。这一架构计划将在2024年推出，它将在每瓦性能、计算密度、内存容量与带宽方面均实现超过5倍的性能提升④。

如果没有软件为芯片注入活力，它将仅只是砂砾。英特尔的软件策略是促进整个堆栈的开放式发展，并提供工具、平台和软件IP，以帮助开发者提升工作效率，产出可扩展、更高性能、更高效的代码，这些代码能充分的利用最新的芯片创新，没有重构代码的负担。oneAPI行业计划为HPC开发者提供了跨架构编程，使代码能透明、可迁移地适用于CPU、GPU和其他专用加速器。

目前，在世界各地领先的科研和学术机构中已有20多个oneAPI卓越中心(CoE)，它们正取得重要的进展。例如，布里斯托大学科学系的Simon McIntosh-Smith和他的团队，正在使用oneAPI和Khronos Group的SYCL抽象层进行跨架构编程，为在E级计算规模上实现性能可移植性开发最佳实践。他们的工作将确保科学代码能在大规模异构超算系统上实现高性能。

随着数据中心和HPC工作负载慢慢的变多采用分布式架构和异构计算，我们应该借助工具来帮助有效管理和应对复杂多样的计算环境。

今天，我们将推出一款开源解决方案IntelXPU Manager，它可以在本地或远程监测和管理英特尔数据中心GPU。该解决方案旨在简化管理，并通过综合诊断更好地实现可靠性和延长设备正常运行时间，以及提升利用率并支持固件更新。

针对能耗很高的数据传输和存储任务，分布式异步对象存储(DAOS)文件系统提供了系统级的优化。DAOS可以显著地改善文件系统的性能，它不但可以缩短整体访问时间，且能降低存储所需的容量，由此减少数据中心的占用空间并提高能源效率。相比于Lustre在I/O500中的测试结果，DAOS实现了直接写入文件系统性能70倍⑤的提升。

我们很荣幸能够与全球志同道合的客户和行业领先的科研机构合作，朝着实现更具可持续性和开放性的高性能计算而努力。我们近期取得了一系列成果——我们与巴塞罗那超算中心合作建立了开创性的RISC-VZ级计算实验室;并与剑桥大学和戴尔继续合作，将当前的E级计算实验室进一步打造成为新的剑桥Z级计算实验室。

独木难支，完整生态的构建需要在制造、芯片、互连、软件和系统等各方面携手共进。通过与整个生态的协作，我们致力于将本世纪最大的HPC挑战转化为前所未有的机遇，创造改变世界的技术，让未来更美好。

①《对2020年至2030年期间全球计算机的一次能源使用、电力使用和二氧化碳排放及其所占份额的假设》，作者：Anders S.G. Andrae，《WSEAS电力系统汇刊》，15(2020)

④Falcon Shores的性能目标基于截至2022年2月相对于当前平台的预测。结果可能不一样。

⑤结果可能有所不同。更多信息请访问io500和YouTube视频《DAOS与Lustre的性能对比测试》

丰等50家合作伙伴，集合全国各地硬创资源，寻找中国最具代表性的硬件创业项目；通过技术上的支持、资源对接、产品推广等方式

快速部署模拟人类视觉的应用程序和解决方案。该工具包基于卷积神经网络（CNN），

在80年代推出的浮点协处理器（FPU）i487，Inmos./ST在1996年推出的多媒体加速器

正在创造性地解决制造业放缓的问题ーー这一次，它把 ABF 基板两侧的电容器增加了一倍如今，

的芯片短缺已导致零部件成本大幅度波动，有时甚至在24小时内波动。这些短缺也导致了被称为“灰色市场

数百万小时软件工程开发的努力,并且标志着一个行业内的变革，从今天受限、封闭的编程方法演变到一个开放的、基于标准的模式，

凭借在软件、芯片和平台、制程和封装以及大规模全球制造商的独特优势，推动

产品和平台的能源效率并降低碳足迹，同时与客户和行业伙伴合作，制订各项解决方案，以降低整个技术生态系统的温室气

始终坚持减少“碳足迹”和扩大技术“手印”并重，不仅降低自身运营“碳足迹”，还携手合作伙伴应用

未来 /

小疆智控CANOpen转PROFINET网关连接EA180C CANOPEN总线型伺服配置案例

贴片NTC热敏电阻在5G电子设备中的应用 NTC热敏电阻温度检测电路实例

#功率因數校正PFC系列 1 省電裝置是线筆誤：交流世界有實功電流與虛功電流）

上一篇: 区块链中的挖矿原理(POW算法)

下一篇: 经济学人全球早报：杭州初中全面取消早读哈尔滨患者3只猫核酸阳性“佛媛”之后再现“病媛”

英特尔聚力整合实现可持续的异构计算

发布日期：2023-09-03

我在德国汉堡举行的2022国际超算大会(ISC2022)上发表了主题演讲，以上内容就是我在演讲中传达的核心信息。

随着数据中心和HPC工作负载慢慢的变多采用分布式架构和异构计算，我们应该借助工具来帮助有效管理和应对复杂多样的计算环境。

④Falcon Shores的性能目标基于截至2022年2月相对于当前平台的预测。结果可能不一样。

⑤结果可能有所不同。更多信息请访问io500和YouTube视频《DAOS与Lustre的性能对比测试》

丰等50家合作伙伴，集合全国各地硬创资源，寻找中国最具代表性的硬件创业项目；通过技术上的支持、资源对接、产品推广等方式

快速部署模拟人类视觉的应用程序和解决方案。该工具包基于卷积神经网络（CNN），

在80年代推出的浮点协处理器（FPU）i487，Inmos./ST在1996年推出的多媒体加速器

正在创造性地解决制造业放缓的问题ーー这一次，它把 ABF 基板两侧的电容器增加了一倍如今，

的芯片短缺已导致零部件成本大幅度波动，有时甚至在24小时内波动。这些短缺也导致了被称为“灰色市场

数百万小时软件工程开发的努力,并且标志着一个行业内的变革，从今天受限、封闭的编程方法演变到一个开放的、基于标准的模式，

凭借在软件、芯片和平台、制程和封装以及大规模全球制造商的独特优势，推动

产品和平台的能源效率并降低碳足迹，同时与客户和行业伙伴合作，制订各项解决方案，以降低整个技术生态系统的温室气

始终坚持减少“碳足迹”和扩大技术“手印”并重，不仅降低自身运营“碳足迹”，还携手合作伙伴应用

未来 /

小疆智控CANOpen转PROFINET网关连接EA180C CANOPEN总线型伺服配置案例

贴片NTC热敏电阻在5G电子设备中的应用 NTC热敏电阻温度检测电路实例

#功率因數校正PFC系列 1 省電裝置是线筆誤：交流世界有實功電流與虛功電流）

上一篇: 区块链中的挖矿原理(POW算法)

下一篇: 经济学人全球早报：杭州初中全面取消早读哈尔滨患者3只猫核酸阳性“佛媛”之后再现“病媛”

英特尔聚力整合实现可持续的异构计算

发布日期：2023-09-03 来源：半岛官网pg

英特尔聚力整合实现可持续的异构计算

发布日期：2023-09-03

导航