tilomichel
/

mT5-base-GermanQuAD-e2e-qg

Text2Text Generation

question generation

Inference Endpoints

Model card Files Files and versions Community

Tilo Michel commited on Jul 2, 2022

Commit

1e4c4aa

•

1 Parent(s): 46d1ff6

Evaluation results in README.md

Files changed (2) hide show

README.md +60 -4
eval_results.json +0 -14

README.md CHANGED Viewed

@@ -20,16 +20,72 @@ tags:
 - question generation
 datasets:
 - deepset/germanquad
-- xquad
-model-index:
-- name: mT5-base-GermanQuAD-e2e-qg
-  results: []
 metrics:
 - sacrebleu
 - bleu
 - rouge-l
 - meteor
 - bertscore
 ---
 # mT5-base finetuned on the GermanQuAD dataset for answer-agnostic question generation

 - question generation
 datasets:
 - deepset/germanquad
 metrics:
 - sacrebleu
 - bleu
 - rouge-l
 - meteor
 - bertscore
+model-index:
+- name: tilomichel/mT5-base-GermanQuAD-e2e-qg
+  results:
+  - task:
+      type: question-generation
+      name: Question generation
+    dataset:
+      type: xquad
+      name: XQuAD (de)
+      split: de
+    metrics:
+      - type: sacrebleu
+        value: 1.72837804716791
+        name: BLEU Score
+        args:
+          lowercase: true
+        verified: false
+      - type: sacrebleu
+        value: 49.210584834334
+        name: BLEU-1
+        args:
+          lowercase: true
+        verified: false
+      - type: sacrebleu
+        value: 16.960300681230915
+        name: BLEU-2
+        args:
+          lowercase: true
+        verified: false
+      - type: sacrebleu
+        value: 7.144635299975106
+        name: BLEU-3
+        args:
+          lowercase: true
+        verified: false
+      - type: sacrebleu
+        value: 3.230076780513635
+        name: BLEU-4
+        args:
+          lowercase: true
+        verified: false
+      - type: rouge
+        name: ROUGE-L (f-measure)
+        value: 0.171130005590873
+        args:
+          use_aggregator: true
+          use_stemmer: false
+        verified: false
+      - type: meteor
+        value: 0.0835049103331918
+        name: METEOR
+        args:
+          language: de
+        verified: false
+      - type: bertscore
+        value: 0.331940584507538
+        name: BERTScore (F1)
+        args:
+          rescale_with_baseline: true
+        verified: false
 ---
 # mT5-base finetuned on the GermanQuAD dataset for answer-agnostic question generation

eval_results.json DELETED Viewed

@@ -1,14 +0,0 @@
-{
-    "epoch": 10,
-    "eval_bertscore": 0.331940584507538,
-    "eval_bleu": 1.72837804716791,
-    "eval_bleu-1": 49.210584834334,
-    "eval_bleu-2": 16.9603006812309,
-    "eval_bleu-3": 7.14463529997511,
-    "eval_bleu-4": 3.23007678051363,
-    "eval_rouge1": 0.231197704900175,
-    "eval_rouge2": 0.0746574903742914,
-    "eval_rougeL": 0.171130005590873,
-    "eval_meteor": 0.0835049103331918,
-    "eval_samples": 244
-}