- https://www.youtube.com/watch?v=0_SRCiGbqzE
32 位浮点并不比 32 位整数“难”在位数,而是难在:
-
要同时处理指数、尾数、符号三条子通道;
-
必须做动态移位、规格化、舍入和异常检测;
-
运算器面积和关键路径都显著增加。
因此,在同等工艺、同等并行度下,浮点运算延迟更长、功耗更高;只有在专用浮点单元被极度堆宽(GPU/AI 加速器)时,吞吐可以追上整数,但“每瓦性能”仍然落后
要同时处理指数、尾数、符号三条子通道;
必须做动态移位、规格化、舍入和异常检测;
运算器面积和关键路径都显著增加。
因此,在同等工艺、同等并行度下,浮点运算延迟更长、功耗更高;只有在专用浮点单元被极度堆宽(GPU/AI 加速器)时,吞吐可以追上整数,但“每瓦性能”仍然落后