热点:

    当64核遇上PCIe4.0 超级算力是这样建成的

      [  品牌资讯   ]  

        我们现在的时代正处于一场算力革命中,大数据、5G、AI人工智能、云计算等领域都对高性能提出了更高的要求,基于所有数据的分析和最终决策都需要高性能计算,这是未来的一片蓝海。

        今天AMD这样的公司已经可以从多个方面来提高算力,其中最关键的部分依然是高性能CPU。AMDCEU苏姿丰此前在接受采访时表示,AMD的使命是提供解决方案,让所有用户都能利用高性能计算来解决一些最有趣和最棘手的挑战。

        针对高性能计算,AMD自从推出Zen架构以来的三年里,最重要的动作就是新一代EPYC7002系列处理器,它不仅从上代的14nm工艺升级到了7nm工艺,同时还从32核升级到了64核,并带来了PCIe4.0总线,使得高性能计算算力大涨的同时,还解决了I/O的瓶颈,可以灵活搭配新一代GPU、网络卡等,系统性地提升了算力。

        EPYC7002系列处理器使用了Zen2架构,这一代最重要的三个特点就是继续提升性能、工艺升级改善能效,同时提高CPU并行能力——更多核心、更多IO等。

        Zen2架构升级:IPC性能大涨、浮点运算能力翻倍

        自从2017年推出第一代Zen架构以来,AMD在处理器性能上已经鱼跃龙门,Zen相比之前的CPU就提升了52%的IPC性能提升,远超业界水平。

        此后AMD的路线图中,Zen架构持续不断优化,不论单核还是多核,性能一直在稳步增长,在Zen2上,AMD依然提升了15%的单核IPC性能,同时优化了多核并行能力,更容易扩展。

        在具体架构上,Zen2上继承了Zen架构的CCX+IF总线+SMT多线程技术,同时在分支预测、缓存系统、整数、浮点等单元上做了改进,并加入了新的指令,提升了安全性。

        最终的结果达到或者说超过了AMD的预期,IPC性能提升15%,浮点运算能力翻倍,频率达提升到4.7GHz+。

        最终在性能上,多核性能更因为翻倍的核心数而大幅领先,性能最多可以翻倍。

        7nm工艺+chiplets小芯片设计:首发64核128线程、算力翻倍不是梦

        在第二代EPYC处理器上,除了Zen2架构在性能上的大量改进,AMD还在业界首发了7nmCPU,先进工艺的加入也让EPYC7002系列处理器脱胎换骨,核心面积更小,同样的功耗下性能提升25%,或者同样的性能下功耗降低了50%。

        光有这些还不够,EPYC7002最终能够实现64核的奇迹还离不开另外一项技术的运用——Chiplets混合小芯片设计,简单来说就是将多个芯片集成到一颗处理器里。

        具体到EPYC7002处理器中,它实际上就是由8组CCD核心、1组IOD核心组成,前者就是CPU核心,每个CCD内有8个CPU内核+32MBL3缓存,7nm工艺制造,总核心面积74mm2,集成38亿晶体管

        IOD就是专用的IO核心,集成了DDR、PCIe等子单元,有桌面版及服务器版两种,搭配的PCIe4.0通道、内存主控是不同的,服务器版IOD核心面积高达416mm2,更为庞大。

        采用Chiplets小芯片设计,一方面是可以将CPU、IO核心分离,分别使用不同的工艺,然后灵活搭配,避免单一大核心的制造难题,因为目前的工艺水平下,制造单一核心的64核处理器面临着很多困难,成本、良率很难控制。

        根据AMD之前的数据,如果将16核32线程的锐龙3代作为100%基准,那么采用原生核心的16核处理器成本将超过2,至少是两倍的成本。

        如果是EPYC霄龙处理器,那么核心数越多,成本优势就越明显,64核7nm锐龙作为基准的话,那么48核的成本就是0.9,而原生48核设计的成本至少是1.9,依然是两倍水平,而64核设计几乎就是传统CPU工艺的死穴了,几乎没法制造。

        最终,第二代AMDEPYC7002系列处理器,通过采用革命性的Chiplets小芯片设计,克服了制造工艺和成本的挑战,为x86服务器带来了高达64核心128线程的超强算力!

        OneMore Thing:128条PCIe4.0通道给高性能计算插上翅膀

        全新的Zen2架构、7nm工艺、64核128线程几乎就是整个EPYC7002系列处理器的超高起点了,上面每一点都是领先业界的,对手在短时间内都没做到,但它还不是EPYC7002处理器的全部。

        在EPYC7002处理器上,AMD还重点提升了IO设计。在当前的高性能计算中,IO瓶颈实际上要比CPU性能瓶颈更为严重,提升整体的算力不能忽视IO部分,否认很难发挥出64核128线程的强大性能。

        在EPYC7002处理器上,AMD提供了128条PCIe4.0通道,数量及技术双双创造了记录,这是目前已商用的处理器中最为强大的,因为PCIe4.0能够提供2倍的PCIe3.0性能,总带宽高达128GB/s,双向可达256GB/s。

        128PCIe4.0可以让EPYC7002系列的服务器连接更多更强的GPU加速卡或者NVMe设备。从实际测试来看,在3DMark的PCIe功能测试中,PCIe4.0比上代性能提升了70%,CDM硬盘性能也提升了35%到50%,优势明显。

        在64核及PCIe4.0的两大独有优势下,AMD的EPYC7002处理器已经获得新一代小型超算DGX-A100的认可——这是老对手NVIDIA的产品,但在选择芯片时,也只有EPYC7002中的旗舰EPYC7742才符合选择,因为它可以支持双路128核256线程、PCIe4.0加持的15.36TBNVMe硬盘。

        除了新一代服务器、工作站之外,AMD的EPYC7002处理器这一年来收获不菲,在多个高性能计算系统中已经大显身手,包括超快的两台百亿亿次级超级计算机Frontier、EICaptian,都有EPYC霄龙的身影,以及AMDRadeon Instinct加速卡,都是受益于64核128线程及PCIe4.0的强大。

        总之,在高性能计算这个方向上,AMD的EPYC7002系列处理器正在创造奇迹,从发布到现在以来,凭借64核128线程、PCIe4.0的专属优势,它在各大性能测试中展现卓越性能。

        凭借这些优势,AMD的EPYC已经从高性能计算的起跑点领先。正如AMDCEO苏姿丰之前在采访中说的那样,2020年将是高性能计算的一年。无论你是企业客户还是还是个人用户,从更高核心到更宽IO全方位系统性提升的高性能计算都将改变未来的工作和生活。

    news.zol.com.cn true //news.zol.com.cn/753/7530549.html report 4395     我们现在的时代正处于一场算力革命中,大数据、5G、AI人工智能、云计算等领域都对高性能提出了更高的要求,基于所有数据的分析和最终决策都需要高性能计算,这是未来的一片蓝海。今天AMD这样的公司已经可以从多个方面来提高算力,其中最关键的部分依然是高...
    • 猜你喜欢
    • 最新
    • 精选
    • 相关
    推荐问答
    提问
    0

    下载ZOL APP
    秒看最新热品

    内容纠错