Spaces:

asigalov61
/

Allegro-Music-Transformer

Running on Zero

asigalov61 commited on Aug 10, 2024

Commit

49123fc

verified ·

1 Parent(s): 7583533

Update x_transformer.py

Files changed (1) hide show

x_transformer.py CHANGED Viewed

@@ -27,6 +27,7 @@ from functools import partial
 import torch
 from torch import nn, einsum, Tensor
 import torch.nn.functional as F
 from collections import namedtuple
 from functools import wraps
@@ -206,7 +207,7 @@ class Attend(nn.Module):
         # pytorch 2.0 flash attn: q, k, v, mask, dropout, causal, softmax_scale
-        with torch.backends.cuda.sdp_kernel(**config._asdict()):
             out = F.scaled_dot_product_attention(
                 q, k, v,
                 attn_mask = mask,

 import torch
 from torch import nn, einsum, Tensor
 import torch.nn.functional as F
+from torch.nn.attention import SDPBackend, sdpa_kernel
 from collections import namedtuple
 from functools import wraps
         # pytorch 2.0 flash attn: q, k, v, mask, dropout, causal, softmax_scale
+        with sdpa_kernel([SDPBackend.MATH, SDPBackend.EFFICIENT_ATTENTION]):
             out = F.scaled_dot_product_attention(
                 q, k, v,
                 attn_mask = mask,