小道消息:
AMD发布业界领先的科学研究用HPC加速显卡
发布日期:2020-11-17

AMD Instinct MI100加速显卡为高性能计算(HPC)AI 带来革命性变化 ꟷ

 

首款为百亿亿次级时代而设计、采用AMD CDNA架构的加速显卡 ꟷ

 

加利福尼亚州圣克拉拉市讯 —— 20201116 —— AMD(纳斯达克股票代码:AMD)今日发布AMD Instinct MI100加速显卡 —— 业界领先的HPC显卡,同时也是首个突破10 teraflopsFP64)性能的x86服务器显卡。同时MI100有了戴尔、技嘉、HPESupermicro这些加速计算平台的支持,并与AMD EPYC™处理器和ROCm™ 4.0开源软件平台相结合,旨在推动百亿亿次级时代抢先到来。

基于全新AMD CDNA架构,AMD Instinct MI100显卡在与第二代AMD EPYC™处理器搭配使用时可为HPCAI提供性能更强的加速系统。MI100可为HPC提供高达11.5 TFLOPSFP64峰值性能、为AI和机器学习工作负载提供多达46.1 TFLOPSFP32 Matrix峰值性能。相比AMD的上一代加速显卡,MI100借助全新AMD Matrix Core技术,理论上还可为AI训练工作负载提升近7倍的FP16峰值浮点性能。

AMD平台解决方案工程研发全球副总裁Brad Mccredie说:“AMD今天所推出的AMD Instinct MI100 ——业界领先的高性能HPC显卡,迈出了通往百亿亿次级计算道路上的重要一步,我们的新加速显卡直指科学计算中的工作负载,通过与AMD ROCm™开源软件平台相结合,为科学家和研究人员提供一个更为优越的HPC工作基础。

为百亿亿次级时代而打造的开源软件平台

AMD ROCm™开发者软件平台为百亿亿次级计算提供了新基础。作为一个由编译器、编程API库组成的的开源工具集,ROCm™可帮助百亿亿次级软件开发者们打造高性能应用程序。经过优化后的ROCm™ 4.0可为基于MI100的系统带来大规模性能。ROCm™ 4.0已将编译器升级为开源且统一式,支持OpenMP 5.0以及HIP.PyTorchTensorflow框架,这些平台框架在搭配MI100ROCm™ 4.0使用时,在经过优化后可实现更高性能。 ROCm™ 4.0是面向HPCML以及AI应用开发者的全新平台,能够帮助他们打造高性能便携软件。

橡树岭国家实验室科学总监Bronson Messer说:我们已经率先用上了MI100加速显卡,初期效果非常令人惊喜。与其他显卡相比,我们已经看到了高达23倍的性能提升。我们也认识到性能对软件的影响也很重要。事实上,开源的ROCm™软件平台以及HIP开发者工具可以在各种平台上工作,这是我们自推出首款混合CPU/GPU系统以来就一直想要的东西。

 

AMD Instinct MI100加速显卡的关键功能和特点包括:

· 全新AMD CDNA架构 AMD CDNA架构可提供卓越的性能和能效,为AMD显卡提供百亿亿次级时代的性能,同时也是MI100加速显卡的核心

· HPC工作负载提供领先的FP64FP32性能 – 为行业提供领先的11.5 TFLOPS FP64峰值性能、23.1 TFLOPS FP32峰值性能,帮助全球各地的科学家和研究人员加速他们在生命科学、能源、金融、学术、政府、国防等领域的新发现。

· HPCAI打造的全新Matrix Core技术 为单精度和混合精度矩阵运算(如FP32FP16bFloat15Int8Int4)提供超强性能,促进HPCAI的融合。

· 第二代AMD Infinity Fabric技术 – Instinct MI100在服务器中使用三个AMD Infinity Fabric链接时可在PCIe 4.0上提供约2倍的点对点(P2P)峰值I/O带宽以及每张显卡高达340GB/s的总带宽。MI100显卡可配备两个完全连接的Quad显卡单元,其中每个单元可为快速数据分享提供多达552GB/sP2P I/O带宽。

· 高速HBM2内存 具有32GB高带宽HBM2内存,1.2GHz时钟频率,可提供超高的1.23TB/s内存带宽,以支持大型数据集并解决移动数据进出内存的瓶颈。

· 支持PCIe 4.0 – 支持全新PCIe 4.0,理论上从CPUGPU可提供高达64GB/s的峰值传输数据带宽。

 

服务器解决方案案例

AMD Instinct MI100加速显卡预计将于今年年底在企业级市场的主要OEMODM合作伙伴的系统上使用,其中包括:

 

戴尔

戴尔PowerEdge服务器高级副总裁Ravi Pendekanti表示戴尔EMC PowerEdge服务器将支持全新AMD Instinct MI100,它可以让数据分析的更快,这也将帮助我们的客户更好地实现更强大更高效的HPC以及AI负载,一直以来AMD都是支持我们数据中心创新的重要合作伙伴,AMD Instinct加速显卡的高性能非常适合我们的PowerEdge服务器AI&HPC组合。

 

技嘉

技嘉NCBU副总裁Alan Chen表示我们很高兴可以与AMD再次合作,AMD Instinct MI100加速显卡代表了数据中心高性能计算的新水平,为能源研究、分子动力学以及深度学习训练带来了更大的连接性和数据带宽。作为技嘉产品组合中的新加速显卡,现在我们的客户可以期待在一系列科学和工业HPC工作负载中获得更高性能收益。

 

HPE

HPE全球副总裁Bill Mannel表示:客户通过使用HPE Apollo系统的特定功能和性能来解决包括HPC、深度学习和分析在内的一系列复杂数据密集性工作负载,而随着新HPE Apollo 6500 Gen10 Plus系统的推出,我们将通过支持全新且能够实现更大连接和数据处理的AMD Instinct MI100加速显卡以及第二代EPYC™处理器,进一步提升我们的产品组合改善工作负载性能。我们期待继续与AMD进行合作,用业界领先的处理器和加速显卡来扩大我们的产品。

 

Supermicro

Supermicro场景应用引擎和业务发展高级副总裁Vik Malyala表示我们很高兴AMD Instinct MI100加速显卡为高性能计算领域带来了巨大影响,结合全新CDNA架构所带来的计算能力,以及MI100带来的高内存和点对点带宽,我们的客户可获得更卓越的的解决方案,并满足他们的加速计算需求以及关键的企业工作负载。AMD Instinct MI100将为我们的多显卡服务器,以及高性能系统、服务器构建模块解决方案的广泛组合提供一个强有力的补充。

MI100规格参数

计算单元

流处理器

FP64 TFLOPS (峰值)

FP32 TFLOPS (峰值)

FP32 Matrix TFLOPS

(峰值)

FP16/FP16 Matrix
TFLOPS

(峰值)

INT4 | INT8 TOPS

(峰值)

bFloat16 TFLOPs

(峰值)

HBM2
ECC
内存

内存带宽

120

7680

多达11.5

多达3.1

多达46.1

多达184.6

多达184.6

多达 92.3 TFLOPS

32GB

多达1.23 TB/s

 

资源支持

· 了解更多关于AMD Instinct™ Accelerators

· 了解更多关于AMD HPC解决方案

· AMD HPC Solutions中心

· 了解更多关于AMD CDNA

· 了解更多关于AMD第二代EPYC处理器

· 关注AMD官方Facebook

· 关注AMD官方推特

 


热点文章
1
显示核心升级更给力 AMD A10-6800K到货
AMD A10-6800K又进一步提升了处理器内置独显核心的图形处理性能。与此同时,处理器也全新升级成为Richland架构,提升性能的同时也进一步降低了整机的功耗和发热。
2
七夕在家看大片 装机就选AMD A8-5600K
AMD A8-5600K作为打桩机四核APU处理器,该处理器原生内置四颗物理核心,默认核心频率为3.6GHz,在Turbo Core支持下最高可达3.9GHz。
3
七夕送男友倍有面子 i7 4770仅2288元
Intel 酷睿i7 4770采用全新的Haswell架构,拥有更强劲的处理性能。酷睿i7-4770处理器采用22纳米工艺制程设计,其内置核芯显卡HD Graphics 4600。
4
人人都能玩四核 AMD 740合肥热卖433元
AMD速龙II X4 740处理器该处理器默认核心频率为3.2GHz,在AMD Turbo Core技术的支持下最高可达3.7GHz,较高的主频能够保证CPU在游戏过程中的流畅性与稳定性。
5
i5价钱i7性能! 攒机到底用不用至强E3?
如今喜欢攒机的网友越来越多,大部分人都通过DIY的方式来组装自己的电脑。互联网上关于DIY方面的技巧很多,我们可以根据网上的教程就可以轻松攒一台自己满意的机器。
推荐文章
1
七夕在家看大片 装机就选AMD A8-5600K
AMD A8-5600K作为打桩机四核APU处理器,该处理器原生内置四颗物理核心,默认核心频率为3.6GHz,在Turbo Core支持下最高可达3.9GHz。
2
显示核心升级更给力 AMD A10-6800K到货
AMD A10-6800K又进一步提升了处理器内置独显核心的图形处理性能。与此同时,处理器也全新升级成为Richland架构,提升性能的同时也进一步降低了整机的功耗和发热。
3
七夕送男友倍有面子 i7 4770仅2288元
Intel 酷睿i7 4770采用全新的Haswell架构,拥有更强劲的处理性能。酷睿i7-4770处理器采用22纳米工艺制程设计,其内置核芯显卡HD Graphics 4600。
4
人人都能玩四核 AMD 740合肥热卖433元
AMD速龙II X4 740处理器该处理器默认核心频率为3.2GHz,在AMD Turbo Core技术的支持下最高可达3.7GHz,较高的主频能够保证CPU在游戏过程中的流畅性与稳定性。
5
i5价钱i7性能! 攒机到底用不用至强E3?
如今喜欢攒机的网友越来越多,大部分人都通过DIY的方式来组装自己的电脑。互联网上关于DIY方面的技巧很多,我们可以根据网上的教程就可以轻松攒一台自己满意的机器。