ꟷ AMD Instinct MI100加速显卡为高性能计算(HPC)和AI 带来革命性变化 ꟷ
ꟷ 首款为百亿亿次级时代而设计、采用AMD CDNA架构的加速显卡 ꟷ
加利福尼亚州圣克拉拉市讯 —— 2020年11月16日 —— AMD(纳斯达克股票代码:AMD)今日发布了新AMD Instinct MI100加速显卡 —— 业界领先的HPC显卡,同时也是首个突破10 teraflops(FP64)性能的x86服务器显卡。同时MI100有了戴尔、技嘉、HPE和Supermicro这些加速计算平台的支持,并与AMD EPYC™处理器和ROCm™ 4.0开源软件平台相结合,旨在推动百亿亿次级时代的抢先到来。
基于全新AMD CDNA架构,AMD Instinct MI100显卡在与第二代AMD EPYC™处理器搭配使用时可为HPC和AI提供性能更强的加速系统。MI100可为HPC提供高达11.5 TFLOPS的FP64峰值性能、为AI和机器学习工作负载提供多达46.1 TFLOPS的FP32 Matrix峰值性能。相比AMD的上一代加速显卡,MI100借助全新AMD Matrix Core技术,理论上还可为AI训练工作负载提升近7倍的FP16峰值浮点性能。
AMD平台解决方案工程研发全球副总裁Brad Mccredie说:“AMD今天所推出的AMD Instinct MI100 ——业界领先的高性能HPC显卡,迈出了通往百亿亿次级计算道路上的重要一步,我们的新加速显卡直指科学计算中的工作负载,通过与AMD ROCm™开源软件平台相结合,为科学家和研究人员提供了一个更为优越的HPC工作基础。”
为百亿亿次级时代而打造的开源软件平台
AMD ROCm™开发者软件平台为百亿亿次级计算提供了新基础。作为一个由编译器、编程API和库组成的的开源工具集,ROCm™可帮助百亿亿次级软件开发者们打造高性能应用程序。经过优化后的ROCm™ 4.0可为基于MI100的系统带来大规模性能。ROCm™ 4.0已将编译器升级为开源且统一式,可支持OpenMP 5.0以及HIP.PyTorch和Tensorflow框架,这些平台框架在搭配MI100和ROCm™ 4.0使用时,在经过优化后可实现更高性能。 ROCm™ 4.0是面向HPC、ML以及AI应用开发者的全新平台,能够帮助他们打造高性能便携软件。
橡树岭国家实验室科学总监Bronson Messer说:“我们已经率先用上了MI100加速显卡,初期效果非常令人惊喜。与其他显卡相比,我们已经看到了高达2至3倍的性能提升。我们也认识到性能对软件的影响也很重要。事实上,开源的ROCm™软件平台以及HIP开发者工具可以在各种平台上工作,这是我们自推出首款混合CPU/GPU系统以来就一直想要的东西。”
AMD Instinct MI100加速显卡的关键功能和特点包括:
· 全新AMD CDNA架构 – AMD CDNA架构可提供卓越的性能和能效,为AMD显卡提供百亿亿次级时代的性能,同时也是MI100加速显卡的核心。
· 为HPC工作负载提供领先的FP64和FP32性能 – 为行业提供领先的11.5 TFLOPS FP64峰值性能、23.1 TFLOPS FP32峰值性能,帮助全球各地的科学家和研究人员加速他们在生命科学、能源、金融、学术、政府、国防等领域的新发现。
· 为HPC和AI打造的全新Matrix Core技术 – 为单精度和混合精度矩阵运算(如FP32、FP16、bFloat15、Int8和Int4)提供超强性能,促进HPC和AI的融合。
· 第二代AMD Infinity Fabric技术 – Instinct MI100在服务器中使用三个AMD Infinity Fabric链接时,可在PCIe 4.0上提供约2倍的点对点(P2P)峰值I/O带宽以及每张显卡高达340GB/s的总带宽。MI100显卡可配备两个完全连接的Quad显卡单元,其中每个单元可为快速数据分享提供多达552GB/s的P2P I/O带宽。
· 高速HBM2内存 – 具有32GB高带宽HBM2内存,1.2GHz时钟频率,可提供超高的1.23TB/s内存带宽,以支持大型数据集并解决移动数据进出内存的瓶颈。
· 支持PCIe 4.0 – 支持全新PCIe 4.0,理论上从CPU到GPU可提供高达64GB/s的峰值传输数据带宽。
服务器解决方案案例
AMD Instinct MI100加速显卡预计将于今年年底在企业级市场的主要OEM和ODM合作伙伴的系统上使用,其中包括:
戴尔
戴尔PowerEdge服务器高级副总裁Ravi Pendekanti表示:“戴尔EMC PowerEdge服务器将支持全新AMD Instinct MI100,它可以让数据分析的更快,这也将帮助我们的客户更好地实现更强大更高效的HPC以及AI负载,一直以来AMD都是支持我们数据中心创新的重要合作伙伴,AMD Instinct加速显卡的高性能非常适合我们的PowerEdge服务器AI&HPC组合。”
技嘉
技嘉NCBU副总裁Alan Chen表示:“我们很高兴可以与AMD再次合作,AMD Instinct MI100加速显卡代表了数据中心高性能计算的新水平,为能源研究、分子动力学以及深度学习训练带来了更大的连接性和数据带宽。作为技嘉产品组合中的新加速显卡,现在我们的客户可以期待在一系列科学和工业HPC工作负载中获得更高性能收益。”
HPE
HPE全球副总裁Bill Mannel表示:“客户通过使用HPE Apollo系统的特定功能和性能来解决包括HPC、深度学习和分析在内的一系列复杂数据密集性工作负载,而随着新HPE Apollo 6500 Gen10 Plus系统的推出,我们将通过支持全新且能够实现更大连接和数据处理的AMD Instinct MI100加速显卡以及第二代EPYC™处理器,进一步提升我们的产品组合改善工作负载性能。我们期待继续与AMD进行合作,用业界领先的处理器和加速显卡来扩大我们的产品。
Supermicro
Supermicro场景应用引擎和业务发展高级副总裁Vik Malyala表示:“我们很高兴AMD Instinct MI100加速显卡为高性能计算领域带来了巨大影响,结合全新CDNA架构所带来的计算能力,以及MI100带来的高内存和点对点带宽,我们的客户可获得更卓越的的解决方案,并满足他们的加速计算需求以及关键的企业工作负载。AMD Instinct MI100将为我们的多显卡服务器,以及高性能系统、服务器构建模块解决方案的广泛组合提供一个强有力的补充。”
MI100规格参数
计算单元 | 流处理器 | FP64 TFLOPS (峰值) | FP32 TFLOPS (峰值) | FP32 Matrix TFLOPS (峰值) | FP16/FP16 Matrix (峰值) | INT4 | INT8 TOPS (峰值) | bFloat16 TFLOPs (峰值) | HBM2 | 内存带宽 |
120 | 7680 | 多达11.5 | 多达3.1 | 多达46.1 | 多达184.6 | 多达184.6 | 多达 92.3 TFLOPS | 32GB | 多达1.23 TB/s |
资源支持
· 了解更多关于AMD Instinct™ Accelerators
· 了解更多关于AMD HPC解决方案
· 了解更多关于AMD CDNA
· 了解更多关于AMD第二代EPYC处理器
· 关注AMD官方Facebook
· 关注AMD官方推特