AMD发布全新架构计算卡Instinct MI100：AI性能暴涨7倍_新闻中心

企业档案

企业会员1

第14年

百大专升本

和我联系

新闻分类

站内搜索

友情链接

首页 > 新闻中心 > AMD发布全新架构计算卡Instinct MI100：AI性能暴涨7倍

新闻中心

AMD发布全新架构计算卡Instinct MI100：AI性能暴涨7倍

发布时间：2020-12-14 浏览次数：0 返回列表

　　在游戏领域，基于RDNA 2架构的Radeon RX 6000系列显卡已经开始闪亮登场。在高性能计算领域，基于CDNA全新架构的新一代计算卡Instinct MI100也终于登台了！

　　AMD Radeon Instinct系列计算卡已经发展了多款型号，但是在此之前，AMD GPU一直都是一套架构打天下，游戏、计算不分家，自然不利于不同方向的深度优化。

　　今年3月份，AMD宣布了首个专门针对数据中心高性能计算而设计的CDNA架构，从此与RDNA游戏架构分道扬镳。二者虽然还有一些共通点，但在设计、优化上已经泾渭分明，在各自领域的性能、能效也更高。

　　AMD Instinct可以说是专为HPC高性能计算而生的，志在推动超级计算机进入百亿亿次计算时代(ExaScale)。

　　回顾历史，21世纪的前10个年头属于万亿次计算时代(TeraScale)，完全依赖CPU运算；最近10个年头属于千万亿次计算时代(PetaScale)，GPU加速运算展露锋芒。

　　不过近两年，传统的GPU加速计算也已经初显疲态，性能增强曲线也缓了下来，必须实现全新的突破。

　　AMD Instinct MI100是其迄今为止性能最高的HPC GPU，FP64双精度浮点性能首次突破10TFlops(也就是每秒1亿亿次)，并在架构设计上专门加入了Matrix Core(矩阵核心)，用于加速HPC、AI运算，号称在混合精度和FP16半精度的AI负载上，性能提升接近7倍。

　　就拿11.5TFlops的双精度性能来说，2000年排名世界第一的超级计算机ASCI White，这个指标也不过12.3TFlops，但却是付出了600万瓦的功耗、106吨的身材才获得的，Instinct MI100却只要300瓦、1.16千克。

　　Instinct MI100的核心规模翻了一番，显存带宽提升了超过20％，物联无限流量卡,移动流量卡,联通流量卡,电信流量卡招代理，Infinity Fabric带宽提升了整整2倍，但是功耗却完全没变(工艺应当也还是7nm)，新架构的能效可见一斑。

　　新卡的性能更是不可同日而语，FP64双精度、FP32单精度性能均提升74％，FP32矩阵性能提升接近2.5倍，AI负载性能更是几乎7倍的飞跃。

　　在美国能源部旗下的橡树岭国家实验室，AMD MI100计算卡已经在支撑多项百亿亿次科研项目，涉及NAMD分子动力学模拟、CHOLLA星系形成研究、PIConGPU激光放射癌症疗法、GESTS流体动力学等等诸多前沿科技。

　　AMD Instinct MI100计算卡还有一个绝佳搭档，那就是AMD自家的霄龙数据中心处理器，慧与、戴尔、超威、技嘉等多家行业巨头都有提供这种双A方案。

　　从2016年初入江湖的1.x版本，2018年奠定基础的2.0版本，到2019年专注于机器学习的3.0版本，再到如今最新的4.0版本，AMD ROCm已经打造成了一整套针对机器学习、高性能计算的百亿亿次级开发方案，规划中的各项功能特性也基本都已经实现。

　　软件优化的力量无疑是巨大的，可以充分释放硬件潜力，比如说上代MI50，搭配ROCm 3.0的话性能相比于搭配ROCm 2.0可以提升3-4倍，而最新的MI100、ROCm 4.0联合，更是可以轻松带来5-8倍的性能提升。

　　AMD ROCm生态的进步速度非常快，已经有众多领域的头部厂商采纳和支持，而且它沿袭了AMD一贯的原则，那就是完全开源开放，非常方便代码迁移，比如说HACC(宇宙学)只用了一个下午，SPECFEM3D(地震学)半天就搞定，CHOLLA(天体物理学)花了几天，QUDA(量子物理学)也不过21天。