QuestGen

Sleeping

App Files Files Community

DevBM commited on Jul 2, 2024

Commit

0ba53c8

verified ·

1 Parent(s): a88e67a

Adding data caching and using session state for model caching

Browse files

Files changed (1) hide show

app.py +19 -9

app.py CHANGED Viewed

@@ -20,15 +20,19 @@ nlp = spacy.load("en_core_web_sm")
 user_agent = 'QGen/1.0 (channingfisher7@gmail.com)'
 wiki_wiki = wikipediaapi.Wikipedia(user_agent= user_agent,language='en')
-model = None
-tokenizer = None
 def load_model():
-    global model, tokenizer
-    if model is None or tokenizer is None:
-        # Load T5 model and tokenizer
-        model_name = "DevBM/t5-large-squad"
-        model = T5ForConditionalGeneration.from_pretrained(model_name)
-        tokenizer = T5Tokenizer.from_pretrained(model_name)
 # Function to extract keywords using combined techniques
 def extract_keywords(text):
@@ -106,6 +110,9 @@ def export_to_pdf(data):
     # pdf.output("questions.pdf")
     return pdf.output(name='questions.pdf',dest='S').encode('latin1')
 # Streamlit interface
 st.title(":blue[Question Generator from Text]")
 text = st.text_area("Enter text here:", value="Joe Biden, the current US president is on a weak wicket going in for his reelection later this November against former President Donald Trump.")
@@ -137,9 +144,12 @@ if st.button("Generate Questions"):
                 st.write(f"**Entity Link:** {linked_entity}")
             st.write("---")
             data.append((context, keyword, question))
         # Export buttons
-        if data is not None:
             with st.sidebar:
                 st.subheader('Download Content')
                 csv_data = export_to_csv(data)

 user_agent = 'QGen/1.0 (channingfisher7@gmail.com)'
 wiki_wiki = wikipediaapi.Wikipedia(user_agent= user_agent,language='en')
 def load_model():
+    model_name = "DevBM/t5-large-squad"
+    model = T5ForConditionalGeneration.from_pretrained(model_name)
+    tokenizer = T5Tokenizer.from_pretrained(model_name)
+    return model, tokenizer
+# Initialize session state for model and tokenizer
+if 'model' not in st.session_state:
+    st.session_state.model, st.session_state.tokenizer = load_model()
+# Use the model and tokenizer from session state
+model = st.session_state.model
+tokenizer = st.session_state.tokenizer
 # Function to extract keywords using combined techniques
 def extract_keywords(text):
     # pdf.output("questions.pdf")
     return pdf.output(name='questions.pdf',dest='S').encode('latin1')
+if 'data' not in st.session_state:
+    st.session_state.data = None
 # Streamlit interface
 st.title(":blue[Question Generator from Text]")
 text = st.text_area("Enter text here:", value="Joe Biden, the current US president is on a weak wicket going in for his reelection later this November against former President Donald Trump.")
                 st.write(f"**Entity Link:** {linked_entity}")
             st.write("---")
             data.append((context, keyword, question))
+        # Add the data to session state
+        st.session_state.data = data
         # Export buttons
+        if st.session_state.data is not None:
             with st.sidebar:
                 st.subheader('Download Content')
                 csv_data = export_to_csv(data)