本文围绕英特尔在3月19日更新AVX10白皮书及相关开源编译器补丁展开,详细阐述了英特尔在AVX10支持模式上的重大转变,即从原本计划支持256-bit或512-bit模式,转变为全面支持512-bit模式,还说明了相关变更在硬件和编译器层面的影响,以及对处理器的潜在利好。
在3月19日,英特尔对AVX10白皮书以及相关开源编译器的补丁进行了更新。在这之前,AVX10原本是计划依据处理器的类别,分别支持256-bit或者512-bit模式。然而,英特尔现在做出了重大调整,放弃了仅支持256-bit的方案,转而全面支持512-bit模式。
英特尔此前发表的AVX10白皮书中曾有这样的表述,“最高支持可选512-bit浮点 / 整数运算”以及其他一些与256-bit相关的内容。不过,随着3月19日发布的AVX10白皮书3.0修订版的出现,关于AVX10.2“可选512-bit”的表述已经被明确删除。与此同时,英特尔还发表了删除256-bit相关描述的声明,声明中提到:“移除了关于256-bit最大矢量寄存器大小的描述、矢量长度支持枚举,以及支持嵌入式舍入的256-bit指令。”文件还特别指出,AVX10.2支持将同时适用于性能核及能效核。
在更新之后,“可选512-bit”相关表述已经被删除。
3月19日发布的GCC补丁中也有相关说明。新版白皮书中表明,所有平台都将支持512-bit矢量宽度。在之前,能效核最高仅支持256-bit,这就导致混合架构客户端和Atom服务器平台受限于256-bit。而现在情况发生了改变,同时,256-bit四舍五入运算也不再必要,因为当前能效核已直接支持舍入功能,无需通过256-bit运算曲线来实现,并且在硬件层面也将移除相关支持。
基于这样的变更,编译器无需再添加 avx10.x – 256/512选项,仅需简单的 avx10.x就可以支持全矢量长度。这一改变还使得 – mno – evex512选项失去了意义,该选项最初是随着avx10.1 – 256引入的,其作用是在旧平台编译仅支持256-bit的二进制文件以实现部分 avx10.x – 256测试。此外,我们还需要移除256-bit的舍入功能。
从海外Linux社群phoronix处了解到,AMD自Zen4架构就已经支持AVX – 512。英特尔此次发布的白皮书以及相关GCC补丁,可能会给桌面端异构处理器及“至强”系列服务器处理器带来利好。同时,该社群还指出,依据这份白皮书,未来英特尔的能效核(E核)有望完整支持AVX 512-bit运算。
英特尔于3月19日更新AVX10白皮书及相关补丁,放弃256-bit支持方案,全面转向512-bit。相关变更体现在硬件和编译器层面,移除了256-bit相关内容。这一转变可能利好桌面端异构处理器及“至强”系列服务器处理器,未来英特尔能效核也有望完整支持AVX 512-bit运算。
原创文章,作者:Stev,如若转载,请注明出处:https://www.lingtongdata.com/1719.html