為什麼浮點運算比整數運算更消耗資源

  1. 必須同時處理指數、尾數、符號三個子通道;

  2. 必須進行動態移位、規格化、捨入以及異常檢測;

  3. 運算單元面積與關鍵路徑都顯著增加。
    因此,在相同製程、相同並行度下,浮點運算的延遲更長、功耗更高;只有在專用浮點單元被極度加寬(如 GPU/AI 加速器)時,吞吐量才能追上整數,但「每瓦效能」仍然落後