VFNCVTBF16.F.F.W 是否提供 BF16 加减乘除?
不。Zfbfmin/Zvfbfmin 主要提供 BF16 与 FP32 转换;Zvfbfwma 提供拓宽乘加。
将 FP32 窄化为 BF16;按 rm/frm 舍入。
VFNCVTBF16.F.F.W 将2*SEW宽度的fp32元素窄化为SEW宽度的BFloat16元素并写入vd。使用frm舍入模式。每个输出BF16仅有1位符号+8位指数+7位尾数,精度远低于源fp32。属于Zvfbfmin扩展。
VFNCVTBF16.F.F.W 属于 RISC-V BF16 扩展;BF16 是 1 位符号、8 位指数、7 位 fraction 的 16 位浮点格式。
结合 «vfncvtbf16.f.f.w v4, v8 # v4[bf16] = bf16(v8[fp32])» 等实际代码理解该场景。
结合 «vfncvtbf16.f.f.w v4, v8 # v4[bf16] = bf16(v8[fp32])» 等实际代码理解该场景。
不。Zfbfmin/Zvfbfmin 主要提供 BF16 与 FP32 转换;Zvfbfwma 提供拓宽乘加。
向量 BF16 指令要求 SEW=16。