- https://www.youtube.com/watch?v=0_SRCiGbqzE
32 位浮點並不比 32 位整數「難」在位元數,而是難在:
-
必須同時處理指數、尾數、符號三個子通道;
-
必須進行動態移位、規格化、捨入以及異常檢測;
-
運算單元面積與關鍵路徑都顯著增加。
因此,在相同製程、相同並行度下,浮點運算的延遲更長、功耗更高;只有在專用浮點單元被極度加寬(如 GPU/AI 加速器)時,吞吐量才能追上整數,但「每瓦效能」仍然落後
必須同時處理指數、尾數、符號三個子通道;
必須進行動態移位、規格化、捨入以及異常檢測;
運算單元面積與關鍵路徑都顯著增加。
因此,在相同製程、相同並行度下,浮點運算的延遲更長、功耗更高;只有在專用浮點單元被極度加寬(如 GPU/AI 加速器)時,吞吐量才能追上整數,但「每瓦效能」仍然落後