集微网消息,ISC高性能计算大会 2021期间,英伟达宣布在NVIDIA HGX AI超级计算平台中加入融合了AI与高性能计算的新技术,使越来越多的行业能够充分地利用超级计算的力量。
NVIDIA InfiniBand是全球唯一具有完全卸载功能的网络计算的互连系统,通过NDR InfiniBand网络可以轻松扩展性能,以应对产业HPC和科学HPC系统面临的大量挑战。基于NVIDIA Quantum-2单芯片的交换机系统可提供64个NDR 400Gb/s InfiniBand端口(或128个NDR200端口),其端口密度比HDR InfiniBand高出3倍。NVIDIA Quantum-2模块化交换机提供了可扩展的端口配置选项,最高可提供2048个NDR 400Gb/s InfiniBand端口(或4096个NDR200端口),双向总吞吐量达到1.64 Pb/s,是上一代HDR InfiniBand模块化交换机系列的5倍。相比上一代,这款2048端换机的扩展能力增加了6.5倍,采用DragonFly+网络拓扑,只需三个网络Hop就能连接超过一百万个节点。第三代 NVIDIA SHARP 网络计算数据归约技术,比上一代的AI加速能力提高了32倍,可大幅提升高性能产业和科学应用的性能。
Magnum IO GPUDirect Storage提供GPU内存和存储之间的直接内存访问,实现了优异的复杂工作负载处理性能。这条直接的通路让应用程序从低I/O延迟中受益,并能够充分利用到网卡的全部带宽,同时减少CPU在通信中的负载,并可以管理逐渐增加的数据消耗所产生的影响。
英伟达创始人兼CEO黄仁勋表示,HPC 革命始于学术界,并迅速扩展到各行各业。产业各项关键趋势正在推动超指数、超摩尔定律的发展速度,使HPC变成各行业都能使用的工具。
在ISC 2021发布的全球最强系统TOP 500榜单中,有342个系统采用了英伟达技术提供加速,其中包括70%的新系统,与排名前10的8个。英伟达表示,该榜单显示出越来越多的高性能计算中心在使用AI。例如,榜单上使用 InfiniBand 的系统数量比去年增加了20%。随着AI、HPC和模拟数据对于低延迟和加速的需求日益增加,InfiniBand已成为首选网络。
此外,名单上的两个新系统便是英伟达所称的超级云——一种新兴的共享超级计算机,能够同时满足人工智能、高性能计算和云端的需求。
微软Azure利用集群将公有云服务提升到一个新的水平,在TOP500榜单上连续占据第26位到第29位。 它们是超级云的一部分,是一台全球的人工智能超级计算机,如今地球上的任何用户都可以按需使用。Azure系统便是英伟达首席执行官黄仁勋所述“行业高性能计算革命”的一例,即AI与高性能计算和加速计算融合,正在推动科研和行业各个领域的发展。
这些研究对于其需要的各种巨量计算来说不切实际,直到后来加速计算和深度学习出现,人们才重新看到曙光。
黄仁勋在为法国Teratec活动致辞时表示:“当我们听到数字生物学革命、未来工厂革命或数字孪生革命时,同样的基本动态因素也在发挥作用。”这场行业高性能计算革命将席卷数据中心、公有云和混合云以及边缘网络。

