Intel公司近日公布了全新的“APX”(高级性能执行)以及全新的指令集“AVX10”(高级指令扩展10),这是首次让P大核、E小核都能支持AVX-512。在这个新的架构中,大核可以完整执行256/512位指令,而小核则只能执行融合256位指令。 AVX10实际上是AVX-512的超集,不仅包含所有的AVX-512指令,还有256位的矢量寄存器、八个32位的掩码寄存器、支持嵌入式舍入的新版256位指令。在这个新的架构中,P大核可以使用512位矢量,而E小核则限制在256位矢量长度。 随着AVX10的推出,AVX-512也将彻底冻结,不会再有变化,未来对于它的使用都通过AVX10来实现。Intel强调,现有应用基于AVX-512、AVX10的性能是一样的,至少在同等矢量长度下没有区别。AVX2编译的程序,重新编译支持AVX10,会获得性能提升,且无需再次对软件调优。 对于矢量寄存器压力敏感的AVX2程序,获得的性能提升最明显,这要感谢额外的16个矢量寄存器和新的指令。高度线程化的矢量化应用在E核上运行时,可获得更高的总吞吐量。 Intel下一代消费级酷睿处理器是Meteor Lake,依然不会有AVX-512,再下一代的Arrow Lake是否会首次加入AVX10,尚不确认。今年底,Intel将推出第五代可扩展至强Emerald Rapids,只是现有第四代Sapphire Rapids的升级版,因此要到明年的第六代至强Granite Rapids,才会加入AVX10。 至于明年首款纯小核设计的Sierra Forest,是否也会加入AVX10,暂时不清楚。不过,AVX10的落地分为两步,第一步是AVX10.1,用于六代至强Granite Rapids,仅支持512位矢量指令,而不支持融合256位矢量指令。第二步是AVX10.2,应该用于七代至强Clearwater Forest,加入融合256位矢量指令,并加入其他新功能,比如AI数据类型和转换、数据转移优化等等。
本文属于原创文章,如若转载,请注明来源:Intel AVX-512指令集复活https://news.zol.com.cn/826/8267062.html