notesum.ai

Published at November 9

cs.LG

cs.AI

cs.CL

Released Date: November 9, 2024

Authors: Jahid Hasan¹

Aff.: ¹Unknown

Bit-Width Config.	Inference Latency (ms)	Energy Cons. (J)	Cost Red. (%)
FP32 (Baseline)	100	50	0
INT8	60	30	40
INT4	35	20	65