Spaces:

JetBrains-Research
/

long-code-arena

Running

jenyag commited on Jun 3

Commit

834230d

•

1 Parent(s): fd03829

Add dataset names for code completion

Files changed (1) hide show

src/get_results_for_task.py CHANGED Viewed

@@ -60,6 +60,13 @@ def _process_urls(raw_urls: str) -> str:
     html_urls = [model_hyperlink(*re.search(MD_LINK_PATTERN, url.strip()).groups()) for url in raw_urls.split(",")]
     return ", ".join(html_urls)
 def _get_results_dataset(task_id: str) -> pd.DataFrame:
     results_df = load_dataset(
@@ -81,6 +88,7 @@ def _get_results_dataset(task_id: str) -> pd.DataFrame:
         for link, model_name in zip(results_df["model_url"], results_df["Model Name"])
     ]
     if task_id == 'project_code_completion':
         results_df["Dataset"] = [_process_urls(urls) for urls in results_df["Dataset"]]
     results_df["Resources"] = [_process_urls(urls) for urls in results_df["Resources"]]
     results_df = results_df[get_columns_per_task(task_id)]

     html_urls = [model_hyperlink(*re.search(MD_LINK_PATTERN, url.strip()).groups()) for url in raw_urls.split(",")]
     return ", ".join(html_urls)
+def _extract_dataset_name(raw_urls: str) -> str:
+    if not raw_urls:
+        return raw_urls
+    names = [re.search(MD_LINK_PATTERN, url.strip()).group(1) for url in raw_urls.split(",")]
+    return ", ".join(names)
 def _get_results_dataset(task_id: str) -> pd.DataFrame:
     results_df = load_dataset(
         for link, model_name in zip(results_df["model_url"], results_df["Model Name"])
     ]
     if task_id == 'project_code_completion':
+        results_df["Dataset_Names"] = [_extract_dataset_name(urls) for urls in results_df["Dataset"]]
         results_df["Dataset"] = [_process_urls(urls) for urls in results_df["Dataset"]]
     results_df["Resources"] = [_process_urls(urls) for urls in results_df["Resources"]]
     results_df = results_df[get_columns_per_task(task_id)]