Add evaluation results on the squad_v2 config of squad_v2

Beep boop, I am a bot from Hugging Face's automatic model evaluator 👋!\
Your model has been evaluated on the squad_v2 config of the [squad_v2](https://huggingface.co/datasets/squad_v2) dataset by

@lewtun

, using the predictions stored [here](https://huggingface.co/datasets/autoevaluate/autoeval-staging-eval-project-f2158b57-4f5f-457d-9656-edbe0fb0d311-398).\
Accept this pull request to see the results displayed on the [Hub leaderboard](https://huggingface.co/spaces/autoevaluate/leaderboards?dataset=squad_v2).\
Evaluate your model on more datasets [here](https://huggingface.co/spaces/autoevaluate/model-evaluator?dataset=squad_v2).

Files changed (1) hide show

README.md +60 -0

README.md CHANGED Viewed

@@ -3,6 +3,66 @@ language: en
 datasets:
 - squad_v2
 license: cc-by-4.0
 ---
 # roberta-base for QA

 datasets:
 - squad_v2
 license: cc-by-4.0
+model-index:
+- name: autoevaluate/roberta-base-squad2
+  results:
+  - task:
+      type: question-answering
+      name: Question Answering
+    dataset:
+      name: squad_v2
+      type: squad_v2
+      config: squad_v2
+      split: validation
+    metrics:
+    - name: Exact Match
+      type: exact_match
+      value: 79.9309
+      verified: true
+    - name: F1
+      type: f1
+      value: 82.9433
+      verified: true
+    - name: exact
+      type: exact
+      value: 79.9309
+      verified: true
+    - name: f1
+      type: f1
+      value: 82.9433
+      verified: true
+    - name: total
+      type: total
+      value: 11869
+      verified: true
+    - name: HasAns_exact
+      type: HasAns_exact
+      value: 79.9309
+      verified: true
+    - name: HasAns_f1
+      type: HasAns_f1
+      value: 82.9433
+      verified: true
+    - name: HasAns_total
+      type: HasAns_total
+      value: 11869
+      verified: true
+    - name: best_exact
+      type: best_exact
+      value: 79.9309
+      verified: true
+    - name: best_exact_thresh
+      type: best_exact_thresh
+      value: 0.0
+      verified: true
+    - name: best_f1
+      type: best_f1
+      value: 82.9433
+      verified: true
+    - name: best_f1_thresh
+      type: best_f1_thresh
+      value: 0.0
+      verified: true
 ---
 # roberta-base for QA