这些指令使用 vxrm 吗?
不使用。浮点算术和转换使用 frm 或指令规定的固定舍入;vxrm 用于定点舍入指令。
扩展浮点 FMA:wide_product = 扩展(vs1[i] * vs2[i]),vd[i] = -(wide_product) - vd[i]。
VFWNMACC.VV 执行扩展浮点融合乘加/乘减。两个窄向量源元素相乘。乘积扩展到 2*SEW 后按公式 vd[i] = -(wide_product) - vd[i] 与宽 vd 组合,融合为一次舍入。 向量 FP32/FP64 操作需要相应标量 F/D 支持;FP16 由相应向量半精度扩展控制,基础 V 扩展不自动包含半精度算术。
VFWNMACC.VV 的核心是窄输入生成宽乘积,再按 vd[i] = -(wide_product) - vd[i] 与宽 vd 融合。
结合 «vsetvli t0, a0, e16, m1, ta, ma vfwnmacc.vv v2, v4, v6» 等实际代码理解该场景。
不使用。浮点算术和转换使用 frm 或指令规定的固定舍入;vxrm 用于定点舍入指令。