ValiantLabs
/

Llama3.1-8B-ShiningValiant2

Model card Files Files and versions Community

Adding Evaluation Results

#6

by T145 - opened Dec 4, 2024

base: refs/heads/main

←

from: refs/pr/6

Discussion Files changed

Files changed (1) hide show

README.md +5 -5

README.md CHANGED Viewed

@@ -177,7 +177,7 @@ model-index:
         num_few_shot: 0
     metrics:
     - type: inst_level_strict_acc and prompt_level_strict_acc
-      value: 65.24
       name: strict accuracy
     source:
       url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=ValiantLabs/Llama3.1-8B-ShiningValiant2
@@ -207,7 +207,7 @@ model-index:
         num_few_shot: 4
     metrics:
     - type: exact_match
-      value: 11.63
       name: exact match
     source:
       url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=ValiantLabs/Llama3.1-8B-ShiningValiant2
@@ -222,7 +222,7 @@ model-index:
         num_few_shot: 0
     metrics:
     - type: acc_norm
-      value: 8.95
       name: acc_norm
     source:
       url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=ValiantLabs/Llama3.1-8B-ShiningValiant2
@@ -237,7 +237,7 @@ model-index:
         num_few_shot: 0
     metrics:
     - type: acc_norm
-      value: 7.19
       name: acc_norm
     source:
       url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=ValiantLabs/Llama3.1-8B-ShiningValiant2
@@ -254,7 +254,7 @@ model-index:
         num_few_shot: 5
     metrics:
     - type: acc
-      value: 26.38
       name: accuracy
     source:
       url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=ValiantLabs/Llama3.1-8B-ShiningValiant2

         num_few_shot: 0
     metrics:
     - type: inst_level_strict_acc and prompt_level_strict_acc
+      value: 64.96
       name: strict accuracy
     source:
       url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=ValiantLabs/Llama3.1-8B-ShiningValiant2
         num_few_shot: 4
     metrics:
     - type: exact_match
+      value: 12.92
       name: exact match
     source:
       url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=ValiantLabs/Llama3.1-8B-ShiningValiant2
         num_few_shot: 0
     metrics:
     - type: acc_norm
+      value: 8.05
       name: acc_norm
     source:
       url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=ValiantLabs/Llama3.1-8B-ShiningValiant2
         num_few_shot: 0
     metrics:
     - type: acc_norm
+      value: 7.46
       name: acc_norm
     source:
       url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=ValiantLabs/Llama3.1-8B-ShiningValiant2
         num_few_shot: 5
     metrics:
     - type: acc
+      value: 26.46
       name: accuracy
     source:
       url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=ValiantLabs/Llama3.1-8B-ShiningValiant2