fireworks-ai
/

FLUX.1-dev-fp8-flumina

aredden commited on Aug 28, 2024

Commit

6d82dcc

1 Parent(s): 00f5d2c

Small fix for issue where f16 CublasLinear layers weren't being used even when available.

Files changed (1) hide show

float8_quantize.py CHANGED Viewed

@@ -336,7 +336,7 @@ def recursive_swap_linears(
 @torch.inference_mode()
 def swap_to_cublaslinear(model: nn.Module):
-    if not isinstance(CublasLinear, torch.nn.Module):
         return
     for name, child in model.named_children():
         if isinstance(child, nn.Linear) and not isinstance(

 @torch.inference_mode()
 def swap_to_cublaslinear(model: nn.Module):
+    if not isinstance(CublasLinear, type(torch.nn.Module)):
         return
     for name, child in model.named_children():
         if isinstance(child, nn.Linear) and not isinstance(