Spaces:

TheFinAI
/

open-finllm-reasoning-leaderboard

Running

lfqian commited on 26 days ago

Commit

6ba19d2

verified ·

1 Parent(s): 773afc6

Update src/populate.py

Files changed (1) hide show

src/populate.py CHANGED Viewed

@@ -10,18 +10,19 @@ from src.leaderboard.read_evals import get_raw_eval_results
 def get_leaderboard_df(results_path: str, requests_path: str, cols: list, benchmark_cols: list) -> pd.DataFrame:
     """Creates a dataframe from all the individual experiment results"""
-    #raw_data = get_raw_eval_results(results_path, requests_path)
-    #all_data_json = [v.to_dict() for v in raw_data]
-    #df = pd.DataFrame.from_records(all_data_json)
-    #df = df.sort_values(by=[AutoEvalColumn.average.name], ascending=False)
-    #df = df[cols].round(decimals=2)
-    # filter out if any of the benchmarks have not been produced
     import os
     print(os.getcwd())  # 获取并打印当前工作目录
-    df = pd.read_csv('model_performance.csv')#df[has_no_nan_values(df, benchmark_cols)]
     return df

 def get_leaderboard_df(results_path: str, requests_path: str, cols: list, benchmark_cols: list) -> pd.DataFrame:
     """Creates a dataframe from all the individual experiment results"""
+    raw_data = get_raw_eval_results(results_path, requests_path)
+    all_data_json = [v.to_dict() for v in raw_data]
+    df = pd.DataFrame.from_records(all_data_json)
+    df = df.sort_values(by=[AutoEvalColumn.average.name], ascending=False)
+    df = df[cols].round(decimals=2)
+    filter out if any of the benchmarks have not been produced
     import os
     print(os.getcwd())  # 获取并打印当前工作目录
+    df = df[has_no_nan_values(df, benchmark_cols)] #pd.read_csv('model_performance.csv')#
+    print(df)
     return df