Spaces:

itsmariamaraki
/

Enron-Email-Dataset

Runtime error

App Files Files Community

itsmariamaraki commited on Apr 14, 2024

Commit

3e819ab

verified ·

1 Parent(s): 3104f9a

Update assessment3_maria_maraki.py

Browse files

Files changed (1) hide show

assessment3_maria_maraki.py +6 -11

assessment3_maria_maraki.py CHANGED Viewed

@@ -7,7 +7,9 @@ Original file is located at
     https://colab.research.google.com/drive/1jm_hI8O4Y0HgNNdWLnkLBIjlzSaGwwBS
 """
 """Since the dataset **emails.csv** in the [Enron Email Dataset](https://www.kaggle.com/datasets/wcukierski/enron-email-dataset/code) was too big, I split the original dataset into smaller .csv files and then chose one of the split files: ***emails_subset.csv***
@@ -51,10 +53,7 @@ pd.set_option('display.max_columns',None,
               'display.max_colwidth',None
              )
-from google.colab import drive
-drive.mount('/content/drive')
-email_data = pd.read_csv('/content/drive/MyDrive/data/emails_subset.csv')
 email_data.head()
@@ -83,7 +82,7 @@ from langchain.document_loaders import DirectoryLoader
 import warnings
 warnings.filterwarnings('ignore')
-openAI_embeddings = OpenAIEmbeddings(openai_api_key="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")
 content = []
 for item in email_data.message:
@@ -116,7 +115,7 @@ The fine-tuning task kept crushing my notebook and I had to restart so I stored
 """# Gradio Interface that answers questions related to the case"""
-email_data_retrieval = RetrievalQA.from_chain_type(llm=OpenAI(openai_api_key="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",
                                                               temperature=0.6,
                                                               top_p=0.5,
                                                               max_tokens=500),
@@ -135,7 +134,3 @@ iface = gradio.Interface(
 iface.launch()

     https://colab.research.google.com/drive/1jm_hI8O4Y0HgNNdWLnkLBIjlzSaGwwBS
 """
+###########################################################################################################################################################
+#The provided code has undergone minor adjustments from its original source (colab enviroment) to ensure its compatibility with the Hugging Face ecosystem.
+###########################################################################################################################################################
 """Since the dataset **emails.csv** in the [Enron Email Dataset](https://www.kaggle.com/datasets/wcukierski/enron-email-dataset/code) was too big, I split the original dataset into smaller .csv files and then chose one of the split files: ***emails_subset.csv***
               'display.max_colwidth',None
              )
+email_data = pd.read_csv('emails_subset.csv')
 email_data.head()
 import warnings
 warnings.filterwarnings('ignore')
+openAI_embeddings = OpenAIEmbeddings(openai_api_key=os.environ.get('OPENAI_API_KEY'))
 content = []
 for item in email_data.message:
 """# Gradio Interface that answers questions related to the case"""
+email_data_retrieval = RetrievalQA.from_chain_type(llm=OpenAI(openai_api_key=os.environ.get('OPENAI_API_KEY'),
                                                               temperature=0.6,
                                                               top_p=0.5,
                                                               max_tokens=500),
 iface.launch()