kazandaev
/

opus-mt-ru-en-finetuned

Text2Text Generation

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

kazandaev commited on Feb 22, 2022

Commit

886675d

•

1 Parent(s): c6588af

update model card README.md

Files changed (1) hide show

README.md +56 -28

README.md CHANGED Viewed

@@ -1,33 +1,61 @@
 ---
 tags:
-- translation
-license: apache-2.0
 ---
-### opus-mt-ru-en
-* source languages: ru
-* target languages: en
-*  OPUS readme: [ru-en](https://github.com/Helsinki-NLP/OPUS-MT-train/blob/master/models/ru-en/README.md)
-*  dataset: opus
-* model: transformer-align
-* pre-processing: normalization + SentencePiece
-* download original weights: [opus-2020-02-26.zip](https://object.pouta.csc.fi/OPUS-MT-models/ru-en/opus-2020-02-26.zip)
-* test set translations: [opus-2020-02-26.test.txt](https://object.pouta.csc.fi/OPUS-MT-models/ru-en/opus-2020-02-26.test.txt)
-* test set scores: [opus-2020-02-26.eval.txt](https://object.pouta.csc.fi/OPUS-MT-models/ru-en/opus-2020-02-26.eval.txt)
-## Benchmarks
-| testset               | BLEU  | chr-F |
-|-----------------------|-------|-------|
-| newstest2012.ru.en 	| 34.8 	| 0.603 |
-| newstest2013.ru.en 	| 27.9 	| 0.545 |
-| newstest2014-ruen.ru.en 	| 31.9 	| 0.591 |
-| newstest2015-enru.ru.en 	| 30.4 	| 0.568 |
-| newstest2016-enru.ru.en 	| 30.1 	| 0.565 |
-| newstest2017-enru.ru.en 	| 33.4 	| 0.593 |
-| newstest2018-enru.ru.en 	| 29.6 	| 0.565 |
-| newstest2019-ruen.ru.en 	| 31.4 	| 0.576 |
-| Tatoeba.ru.en 	| 61.1 	| 0.736 |

 ---
 tags:
+- generated_from_trainer
+metrics:
+- bleu
+model-index:
+- name: opus-mt-ru-en-finetuned
+  results: []
 ---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# opus-mt-ru-en-finetuned
+This model was trained from scratch on the None dataset.
+It achieves the following results on the evaluation set:
+- Loss: 1.2874
+- Bleu: 34.0221
+- Gen Len: 26.0071
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 0.0001
+- train_batch_size: 85
+- eval_batch_size: 42
+- seed: 42
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- num_epochs: 3
+### Training results
+| Training Loss | Epoch | Step  | Validation Loss | Bleu    | Gen Len |
+|:-------------:|:-----:|:-----:|:---------------:|:-------:|:-------:|
+| 1.343         | 1.0   | 20262 | 1.4699          | 31.0248 | 25.9972 |
+| 1.2232        | 2.0   | 40524 | 1.3449          | 32.8246 | 26.1448 |
+| 1.1324        | 3.0   | 60786 | 1.2874          | 34.0221 | 26.0071 |
+### Framework versions
+- Transformers 4.16.2
+- Pytorch 1.10.2+cu113
+- Datasets 1.18.3
+- Tokenizers 0.11.0