Spaces:

seemapatil
/

text_tagging

Build error

seemapatil commited on Jul 4, 2023

Commit

3db2689

1 Parent(s): bf65949

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,5 +1,5 @@
 from transformers import AutoTokenizer, AutoModelForSequenceClassification, TrainingArguments
-from datasets import load_dataset
 import csv
 # Read requirements.txt file
@@ -19,8 +19,11 @@ with open('IMDB Dataset.csv', 'r') as csv_file:
         }
         preprocessed_data.append(preprocessed_entry)
-# Convert the preprocessed data to a dataset
-dataset = load_dataset('csv', data=preprocessed_data, delimiter=',')
 # Tokenize the dataset
 tokenizer = AutoTokenizer.from_pretrained("bigscience/bloom-560m")
@@ -38,3 +41,4 @@ import numpy as np
 import evaluate
 metric = evaluate.load("accuracy")

 from transformers import AutoTokenizer, AutoModelForSequenceClassification, TrainingArguments
+from datasets import pandas, Dataset
 import csv
 # Read requirements.txt file
         }
         preprocessed_data.append(preprocessed_entry)
+# Convert the preprocessed data to a pandas DataFrame
+df = pandas.DataFrame(preprocessed_data)
+# Convert the DataFrame to a datasets dataset
+dataset = Dataset.from_pandas(df)
 # Tokenize the dataset
 tokenizer = AutoTokenizer.from_pretrained("bigscience/bloom-560m")
 import evaluate
 metric = evaluate.load("accuracy")