Spaces:

Dr-BERT
/

CAS-Biomedical-POS-Tagging

Runtime error

qanastek commited on Apr 5, 2023

Commit

2a493e6

1 Parent(s): bdba6de

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -31,17 +31,20 @@ elif context == "New Text":
 def setModel(model_checkpoint, aggregation):
     model = AutoModelForTokenClassification.from_pretrained(model_checkpoint)
     tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
-    return pipeline('token-classification', model=model, tokenizer=tokenizer, aggregation_strategy=aggregation)
 Run_Button = st.button("Run", key=None)
 if Run_Button == True:
-    ner_pipeline = setModel(model_checkpoint, aggregation)
     output = ner_pipeline(input_text)
-    print(output)
-    df = pd.DataFrame.from_dict(output)
     if aggregation != "none":
         df.rename(index=str,columns={'entity_group':'POS Tag'},inplace=True)

 def setModel(model_checkpoint, aggregation):
     model = AutoModelForTokenClassification.from_pretrained(model_checkpoint)
     tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
+    return pipeline('token-classification', model=model, tokenizer=tokenizer, aggregation_strategy=aggregation), model.config.id2label
 Run_Button = st.button("Run", key=None)
 if Run_Button == True:
+    ner_pipeline, id2label = setModel(model_checkpoint, aggregation)
     output = ner_pipeline(input_text)
+    output_new = []
+    for o in output:
+        o["entity_group"] = id2label[o["entity_group"].split("_")[-1]]
+        output_new.append(o)
+    df = pd.DataFrame.from_dict(output_new)
     if aggregation != "none":
         df.rename(index=str,columns={'entity_group':'POS Tag'},inplace=True)