metadata

tags:
  - generated_from_trainer
model-index:
  - name: arwiki_mlm
    results: []
metrics:
  - perplexity
license: mit
datasets:
  - SaiedAlshahrani/Arabic_Wikipedia_20230101
language:
  - ar
library_name: transformers
pipeline_tag: fill-mask
widget:
  - text: الهدف من الحياة هو  <mask>

arwiki_mlm (arRoBERTa)

This model is a fine-tuned version of on an unknown dataset. It achieves the following results on the evaluation set:

Pseudo-Perplexity:

Model description

More information needed

Intended uses & limitations

More information needed

Training and evaluation data

More information needed

Training procedure

Training hyperparameters

The following hyperparameters were used during training:

learning_rate: 0.0001
train_batch_size: 256
eval_batch_size: 8
seed: 42
optimizer: Adam with betas=(0.9,0.98) and epsilon=1e-06
lr_scheduler_type: linear
num_epochs: 5

Training results

Epoch	Step	Training Loss
1	3000	5.681200
2	6000	3.777100
3	9000	3.246300
4	12000	3.012100
5	15000	2.888400

Train Runtime	Train Samples Per Second	Train Steps Per Second	Total Flos	Train Loss	Epoch
17048.756800	248.355000	0.970000	140390797515571200.000000	3.639375	5.000000

Framework versions

Datasets 2.9.0
Tokenizers 0.12.1
Transformers 4.24.0
Pytorch 1.12.1+cu116