为什么浮点运算比整数运算更消耗资源

  1. 需要同时处理指数、尾数和符号三个子通道;

  2. 必须进行动态移位、规格化、舍入以及异常检测;

  3. 运算器的面积和关键路径均显著增加。

因此,在相同工艺和并行度下,浮点运算的延迟更长、功耗更高;只有在专用浮点单元被极度加宽(如 GPU/AI 加速器)时,吞吐量才能接近整数运算,但“每瓦性能”仍然落后。