- https://www.youtube.com/watch?v=0_SRCiGbqzE
32 位浮点数相比 32 位整数在位数上并不“多”,其复杂性在于:
-
需要同时处理指数、尾数和符号三个子通道;
-
必须进行动态移位、规格化、舍入以及异常检测;
-
运算器的面积和关键路径均显著增加。
因此,在相同工艺和并行度下,浮点运算的延迟更长、功耗更高;只有在专用浮点单元被极度加宽(如 GPU/AI 加速器)时,吞吐量才能接近整数运算,但“每瓦性能”仍然落后。
需要同时处理指数、尾数和符号三个子通道;
必须进行动态移位、规格化、舍入以及异常检测;
运算器的面积和关键路径均显著增加。
因此,在相同工艺和并行度下,浮点运算的延迟更长、功耗更高;只有在专用浮点单元被极度加宽(如 GPU/AI 加速器)时,吞吐量才能接近整数运算,但“每瓦性能”仍然落后。