Spaces:

Soumen
/

Text-Summarization-and-NLP-tasks

Running

Soumen commited on Aug 29, 2023

Commit

c9a18bc

1 Parent(s): ad33706

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -52,8 +52,8 @@ import line_cor
 import altair as alt
 #pytesseract.pytesseract.tesseract_cmd = r"./Tesseract-OCR/tesseract.exe"
 from PIL import Image
-#@st.experimental_singleton
-@st.cache_resource(experimental_allow_widgets=True)
 def read_pdf(file):
 #     images=pdf2image.convert_from_path(file)
 #     # print(type(images))
@@ -87,23 +87,23 @@ def read_pdf(file):
 #     all_page_text += text + " " #page.extractText()
 #     return all_page_text
 st.title("NLP APPLICATION")
-#@st.experimental_singleton
-@st.cache_resource(experimental_allow_widgets=True)
 def text_analyzer(my_text):
 	nlp = spacy.load('en_core_web_sm')
 	docx = nlp(my_text)
 	# tokens = [ token.text for token in docx]
 	allData = [('"Token":{},\n"Lemma":{}'.format(token.text,token.lemma_))for token in docx ]
 	return allData
-#@st.experimental_singleton
-@st.cache_resource(experimental_allow_widgets=True)
 def load_models():
     tokenizer = AutoTokenizer.from_pretrained('gpt2-large')
     model = GPT2LMHeadModel.from_pretrained('gpt2-large')
     return tokenizer, model
 # Function For Extracting Entities
-#@st.experimental_singleton
-@st.cache_resource(experimental_allow_widgets=True)
 def entity_analyzer(my_text):
 	nlp = spacy.load('en_core_web_sm')
 	docx = nlp(my_text)

 import altair as alt
 #pytesseract.pytesseract.tesseract_cmd = r"./Tesseract-OCR/tesseract.exe"
 from PIL import Image
+@st.experimental_singleton
+#@st.cache_resource(experimental_allow_widgets=True)
 def read_pdf(file):
 #     images=pdf2image.convert_from_path(file)
 #     # print(type(images))
 #     all_page_text += text + " " #page.extractText()
 #     return all_page_text
 st.title("NLP APPLICATION")
+@st.experimental_singleton
+#@st.cache_resource(experimental_allow_widgets=True)
 def text_analyzer(my_text):
 	nlp = spacy.load('en_core_web_sm')
 	docx = nlp(my_text)
 	# tokens = [ token.text for token in docx]
 	allData = [('"Token":{},\n"Lemma":{}'.format(token.text,token.lemma_))for token in docx ]
 	return allData
+@st.experimental_singleton
+#@st.cache_resource(experimental_allow_widgets=True)
 def load_models():
     tokenizer = AutoTokenizer.from_pretrained('gpt2-large')
     model = GPT2LMHeadModel.from_pretrained('gpt2-large')
     return tokenizer, model
 # Function For Extracting Entities
+@st.experimental_singleton
+#@st.cache_resource(experimental_allow_widgets=True)
 def entity_analyzer(my_text):
 	nlp = spacy.load('en_core_web_sm')
 	docx = nlp(my_text)