VFWREDUSUM.VS 的结果是否可重复?
ISA 允许无序归约采用不同归约树;浮点舍入可能随实现或设置不同而变化。需要有序语义时使用 VFWREDOSUM.VS。
将活动的 vs2 浮点元素拓宽后做无序归约求和,以 vs1[0] 作为宽精度初值并写入 vd[0]。
VFWREDUSUM.VS 是 RISC-V V 扩展的拓宽浮点无序归约求和指令。它把活动的窄 vs2 元素扩展到 2*SEW 精度,与宽精度初值 vs1[0] 组成归约树;结果只写入 vd[0]。无序归约允许实现选择归约顺序,因此浮点舍入结果不要求与有序归约逐项一致。
VFWREDUSUM.VS 做拓宽浮点无序求和;如果需要固定元素顺序的语义,应查看 VFWREDOSUM.VS。
结合 «vsetvli t0, a0, e16, m1, ta, ma vfwredusum.vs v2, v4, v3» 等实际代码理解该场景。
ISA 允许无序归约采用不同归约树;浮点舍入可能随实现或设置不同而变化。需要有序语义时使用 VFWREDOSUM.VS。
vm=0 时用 v0 选择活动元素,vm=1 时所有 body 元素都参与;非活动和尾部元素按当前策略处理。