Tele-AI
/

TeleChat-52B

liusx commited on Aug 27

Commit

fde5b7a

•

1 Parent(s): 540a64e

fix bug when fine-tuning without flash-attention

Files changed (1) hide show

modeling_telechat.py CHANGED Viewed

@@ -270,6 +270,7 @@ class TELECHATAttention(nn.Module):
         self.pruned_heads = set()
         self.use_flash_attn = False

         self.pruned_heads = set()
         self.use_flash_attn = False
+        self.is_cross_attention = False