Spaces:

XAI
/

Cleaning-ImageNet-Hard

Paused

taesiri commited on May 2, 2023

Commit

19e99f5

•

1 Parent(s): 3eb3dd3

backup

Files changed (1) hide show

app.py CHANGED Viewed

@@ -19,8 +19,8 @@ import torchvision
 from huggingface_hub import HfApi, login, snapshot_download
 from PIL import Image
-session_token = os.environ.get("SessionToken")
-login(token=session_token)
 csv.field_size_limit(sys.maxsize)
@@ -83,8 +83,23 @@ def update_snapshot(username):
             rows.append(tdf)
     df = pd.DataFrame(rows, columns=columns)
-    df = df[df["user_id"] == username]
     return df

 from huggingface_hub import HfApi, login, snapshot_download
 from PIL import Image
+# session_token = os.environ.get("SessionToken")
+# login(token=session_token)
 csv.field_size_limit(sys.maxsize)
             rows.append(tdf)
     df = pd.DataFrame(rows, columns=columns)
+    # download and append all CSV files
+    output_dir = snapshot_download(
+        repo_id="taesiri/imagenet_hard_review_data_r3",
+        allow_patterns="*.csv",
+        repo_type="dataset",
+    )
+    files = glob(f"{output_dir}/*.csv")
+    if len(files) > 0:
+        csv_dataframes = [pd.read_csv(file) for file in files]
+        csv_dataframes = pd.concat(csv_dataframes, ignore_index=True)
+        df = pd.concat([df, csv_dataframes], ignore_index=True)
+    # remove duplicate rows
+    df = df.drop_duplicates(subset=["id", "user_id"], keep="last")
+    df = df[df["user_id"] == username]
     return df