impresso-project
/

nel-mgenre-multilingual

Text2Text Generation

entity-retrieval

named-entity-disambiguation

entity-disambiguation

named-entity-linking

Inference Endpoints

Model card Files Files and versions Community

Emanuela Boros commited on Oct 17, 2024

Commit

8d26403

•

1 Parent(s): 90f2fe8

added pipeline

Files changed (1) hide show

generic_nel.py +3 -30

generic_nel.py CHANGED Viewed

@@ -1,16 +1,9 @@
 from transformers import Pipeline
-import numpy as np
-import torch
 import nltk
 nltk.download("averaged_perceptron_tagger")
 nltk.download("averaged_perceptron_tagger_eng")
-from nltk.chunk import conlltags2tree
-from nltk import pos_tag
-from nltk.tree import Tree
 import requests
-import torch.nn.functional as F
-import re, string
 def get_wikipedia_page_props(input_str: str):
@@ -104,7 +97,7 @@ class NelPipeline(Pipeline):
         wikipedia_predictons = self.tokenizer.batch_decode(
             outputs, skip_special_tokens=True
         )
-        print(f"Decoded: {wikipedia_predictons}")
         return wikipedia_predictons
@@ -118,32 +111,12 @@ class NelPipeline(Pipeline):
         :param kwargs:
         :return:
         """
-        # outputs
-        #
-        # predictions = {}
-        # confidence_scores = {}
-        # for task, logits in tokens_result.logits.items():
-        #     predictions[task] = torch.argmax(logits, dim=-1).tolist()[0]
-        #     confidence_scores[task] = F.softmax(logits, dim=-1).tolist()[0]
-        #
-        # entities = {}
-        # for task in predictions.keys():
-        #     words_list, preds_list, confidence_list = realign(
-        #         text_sentence,
-        #         predictions[task],
-        #         confidence_scores[task],
-        #         self.tokenizer,
-        #         self.id2label[task],
-        #     )
-        #
-        #     entities[task] = get_entities(words_list, preds_list, confidence_list, text)
-        #
-        # postprocessed_entities = self.postprocess_entities(entities, text_sentence)
         results = []
         for wikipedia_name in outputs:
             # Get QID
             qid = get_wikipedia_page_props(wikipedia_name)
-            print(f"{wikipedia_name} -- QID: {qid}")
             # Get Wikipedia title and URL
             title, url = get_wikipedia_title(qid)

 from transformers import Pipeline
 import nltk
 nltk.download("averaged_perceptron_tagger")
 nltk.download("averaged_perceptron_tagger_eng")
 import requests
 def get_wikipedia_page_props(input_str: str):
         wikipedia_predictons = self.tokenizer.batch_decode(
             outputs, skip_special_tokens=True
         )
+        # print(f"Decoded: {wikipedia_predictons}")
         return wikipedia_predictons
         :param kwargs:
         :return:
         """
         results = []
         for wikipedia_name in outputs:
             # Get QID
             qid = get_wikipedia_page_props(wikipedia_name)
+            # print(f"{wikipedia_name} -- QID: {qid}")
             # Get Wikipedia title and URL
             title, url = get_wikipedia_title(qid)