为什么浮点运算比整数运算更消耗资源

  1. 要同时处理指数、尾数、符号三条子通道;

  2. 必须做动态移位、规格化、舍入和异常检测;

  3. 运算器面积和关键路径都显著增加。
    因此,在同等工艺、同等并行度下,浮点运算延迟更长、功耗更高;只有在专用浮点单元被极度堆宽(GPU/AI 加速器)时,吞吐可以追上整数,但“每瓦性能”仍然落后