baseplate
/

splade-cocondenser-selfdistil

query-expansion

document-expansion

passage-retrieval

knowledge-distillation

Inference Endpoints

Model card Files Files and versions Community

andrewluo commited on Mar 27, 2023

Commit

f44ab2c

·

1 Parent(s): a630f6d

Update handler.py

Files changed (1) hide show

handler.py +16 -11

handler.py CHANGED Viewed

@@ -22,14 +22,19 @@ class EndpointHandler():
         text = data.pop("text", data)
         tokens = self.tokenizer(text, return_tensors='pt', padding=True)
         output = self.model(**tokens)
-        vec = torch.max(
-            torch.log(
-                1 + torch.relu(output.logits)
-            ) * tokens.attention_mask.unsqueeze(-1),
-            dim=1)[0].squeeze()
-        cols = vec.nonzero().squeeze().cpu().tolist()
-        # extract the non-zero values
-        weights = vec[cols].cpu().tolist()
-        # use to create a dictionary of token ID to weight
-        sparse_dict = dict(zip(map(str, cols), weights))
-        return sparse_dict

         text = data.pop("text", data)
         tokens = self.tokenizer(text, return_tensors='pt', padding=True)
         output = self.model(**tokens)
+        results = []
+        for idx, x in enumerate(outputs.logits):
+            mask = tokens.attention_mask[idx]
+            mask = mask[None,:]
+            vec = torch.max(
+                torch.log(
+                    1 + torch.relu(x)
+                ) * mask.unsqueeze(-1),
+                dim=1)[0].squeeze()
+            cols = vec.nonzero().squeeze().cpu().tolist()
+            # extract the non-zero values
+            weights = vec[cols].cpu().tolist()
+            # use to create a dictionary of token ID to weight
+            sparse_dict = dict(zip(map(str, cols), weights))
+            results.append(sparse_dict)
+        return results