这些指令使用 vxrm 吗?
不使用。浮点算术和转换使用 frm 或指令规定的固定舍入;vxrm 用于定点舍入指令。
扩展浮点 FMA:wide_product = 扩展(f[rs1] * vs2[i]),vd[i] = -(wide_product) + vd[i]。
VFWNMSAC.VF 执行扩展浮点融合乘加/乘减。窄浮点标量 f[rs1] 与窄向量元素 vs2[i] 相乘。乘积扩展到 2*SEW 后按公式 vd[i] = -(wide_product) + vd[i] 与宽 vd 组合,融合为一次舍入。 向量 FP32/FP64 操作需要相应标量 F/D 支持;FP16 由相应向量半精度扩展控制,基础 V 扩展不自动包含半精度算术。
VFWNMSAC.VF 的核心是窄输入生成宽乘积,再按 vd[i] = -(wide_product) + vd[i] 与宽 vd 融合。
结合 «vsetvli t0, a0, e16, m1, ta, ma vfwnmsac.vf v2, ft0, v4» 等实际代码理解该场景。
不使用。浮点算术和转换使用 frm 或指令规定的固定舍入;vxrm 用于定点舍入指令。