Spaces:

VOCALINLP
/

punctuation_and_capitalization_restoration_sanivert

Runtime error

App Files Files Community

jcg00v commited on Mar 4, 2024

Commit

658014d

verified ·

1 Parent(s): 1515661

Update app.py

Browse files

Files changed (1) hide show

app.py +28 -3

app.py CHANGED Viewed

@@ -183,12 +183,11 @@ def footer():
     myargs = [
         "Made in ",
-        "<img src='data:image/jpg;base64,{}' class='img-fluid' width='80' height='80'>".format(
         img_to_bytes(str(logo_path) + "/vocali_logo.jpg")
         ),
-        link("https://vocali.net/", "VÓCALI"),
         " with funding ",
-        "<img src='data:image/png;base64,{}' class='img-fluid' width='250' height='50'>".format(
         img_to_bytes(str(funding_path)  + "/logo_funding.png")
         ),
         br(),
@@ -203,6 +202,8 @@ if __name__ == "__main__":
         st.session_state.text = ""
     st.title('Sanivert Punctuation And Capitalization Restoration')
     model_es = AutoModelForTokenClassification.from_pretrained("VOCALINLP/spanish_capitalization_punctuation_restoration_sanivert")
     tokenizer_es = AutoTokenizer.from_pretrained("VOCALINLP/spanish_capitalization_punctuation_restoration_sanivert")
     pipe_es = pipeline("token-classification", model=model_es, tokenizer=tokenizer_es)
@@ -215,7 +216,31 @@ if __name__ == "__main__":
     tokenizer_pt = AutoTokenizer.from_pretrained("VOCALINLP/portuguese_capitalization_punctuation_restoration_sanivert")
     pipe_pt = pipeline("token-classification", model=model_pt, tokenizer=tokenizer_pt)
     input_text = st.selectbox(
       label = "Choose an language",
       options = ["Spanish", "Portuguese", "Catalan"]

     myargs = [
         "Made in ",
+        "<img src='data:image/jpg;base64,{}' class='img-fluid' width='100' height='100'>".format(
         img_to_bytes(str(logo_path) + "/vocali_logo.jpg")
         ),
         " with funding ",
+        "<img src='data:image/png;base64,{}' class='img-fluid' width='350' height='100'>".format(
         img_to_bytes(str(funding_path)  + "/logo_funding.png")
         ),
         br(),
         st.session_state.text = ""
     st.title('Sanivert Punctuation And Capitalization Restoration')
+    st.markdown("The model restores the following punctuation -- [? ! , . :] and also the capitalization of words.")
     model_es = AutoModelForTokenClassification.from_pretrained("VOCALINLP/spanish_capitalization_punctuation_restoration_sanivert")
     tokenizer_es = AutoTokenizer.from_pretrained("VOCALINLP/spanish_capitalization_punctuation_restoration_sanivert")
     pipe_es = pipeline("token-classification", model=model_es, tokenizer=tokenizer_es)
     tokenizer_pt = AutoTokenizer.from_pretrained("VOCALINLP/portuguese_capitalization_punctuation_restoration_sanivert")
     pipe_pt = pipeline("token-classification", model=model_pt, tokenizer=tokenizer_pt)
+    st.subheader('Text examples in Spanish')
+    data_spanish = [['has tenido alguna enfermedad en la última semana', '¿Has tenido alguna enfermedad en la última semana?'],
+                    ['sufre la enfermedad de parkinson', 'Sugre la enfermedad de Parkinson'],
+                    ['el paciente presenta los siguientes síntomas náuseas vértigo disnea fiebre y dolor abdominal', 'El paciente presenta los siguientes síntomas: náuseas, vértigo, disnea, fiebre y dolor abdominal.']]
+    st.table(pd.DataFrame(data_spanish, columns=['Input', 'Output']))
+    st.subheader('Text examples in Catalan')
+    data = [['has tingut alguna malaltia a la darrera setmana', 'Has tingut alguna malaltia a la darrera setmana?'],
+          ['pateix la malaltia de parkinson', 'Pateix la malaltia de Parkinson.'],
+          ["pacient presenta els següents símptomes nàusees vertigen dispnea febre i dolor abdominal", "Pacient presenta els següents símptomes: nàusees, vertigen, dispnea, febre i dolor abdominal."]]
+    st.table(pd.DataFrame(data, columns=['Input', 'Output']))
+    st.subheader('Text examples in Portuguese')
+    data_pt = [['sofre da doença de parkinson', 'Sofre da doença de parkinson?'],
+          ['teve alguma doença na última semana', 'Teve alguma doença na última semana?'],
+          ['o doente apresenta os seguintes sintomas náuseas vertigens dispneia febre e dor abdominal', 'O doente apresenta os seguintes sintomas: náuseas, vertigens, dispneia, febre e dor abdominal.']]
+    st.table(pd.DataFrame(data_pt, columns=['Input', 'Output']))
     input_text = st.selectbox(
       label = "Choose an language",
       options = ["Spanish", "Portuguese", "Catalan"]