首页/指令库/FCVT-BF16-S
FCVT.BF16.S

RISC-V FCVT.BF16.S 指令详解

指令手册R-type

将 FP32 窄化为 BF16;按 rm/frm 舍入。

指令语法

fcvt.bf16.s rd, rs1, rm
操作数说明
目标寄存器 rd:存放运算结果的通用寄存器。
源寄存器 rs1:第一个操作数寄存器。
源寄存器 rs2:第二个操作数寄存器。
Zfbfmin浮点转换

指令行为说明

FCVT.BF16.S(Zfbfmin,依赖 F)将 f[rs1] 中的单精度 FP32 值窄化转换为 BF16,并按指令 rm 字段选择的 RISC-V 浮点舍入模式舍入,结果作为 BF16 值写入 f[rd](按较窄浮点结果进行 NaN-box)。它只支持 FP32 与 BF16 之间的最小转换,不提供 BF16 加减乘除。可能设置 Overflow、Underflow、Inexact、Invalid 异常标志。

快速理解与检索要点

FCVT.BF16.S 属于 RISC-V BF16 扩展;BF16 是 1 位符号、8 位指数、7 位 fraction 的 16 位浮点格式。

窄化到 BF16 会舍入并可能设置 OF/UF/NX/NV。
BF16 标量结果/输入遵守 RISC-V NaN-boxing 规则。

常见使用场景

深度学习推理(降精度)

结合 «fcvt.bf16.s f0, f1, rne # f0 = bf16(f1), round nearest even» 等实际代码理解该场景。

BF16模型部署

结合 «fcvt.bf16.s f0, f1, rne # f0 = bf16(f1), round nearest even» 等实际代码理解该场景。

内存带宽优化

结合 «fcvt.bf16.s f0, f1, rne # f0 = bf16(f1), round nearest even» 等实际代码理解该场景。

使用前检查清单

语法检查
  • 确认当前指令格式为 R-type。
  • 确认操作数排列顺序与示例一致。
语义检查
  • 确认目标寄存器用途和调用约定兼容。
  • 确认该指令不是伪指令展开后的底层形式。

容易混淆 / 常见误区

BF16 是 1 位符号、8 位指数、7 位 fraction(p=8)的 16 位格式;动态范围接近 FP32,但精度远低于 FP16。
按 rm 舍入;不是简单截断高 16 位。
Zfbfmin 只提供 BF16/FP32 转换和复用的 FLH/FSH/FMV.H.X/FMV.X.H,不提供原生 BF16 算术。
BF16 subnormal 被这些扩展完整支持;异常标志按 RISC-V 浮点规则设置。

常见问题

FCVT.BF16.S 是否提供 BF16 加减乘除?

不。Zfbfmin/Zvfbfmin 主要提供 BF16 与 FP32 转换;Zvfbfwma 提供拓宽乘加。

FCVT.BF16.S 的 SEW 限制是什么?

标量形式不使用 V 的 SEW;它在浮点寄存器中处理 BF16/FP32 标量值。