Add model files for moroccan dialect

Browse files

Files changed (3) hide show

config.json +9 -9
pytorch_model.bin +3 -0
vocab.json +1 -1

config.json CHANGED Viewed

@@ -1,11 +1,11 @@
 {
   "_name_or_path": "facebook/wav2vec2-large-xlsr-53",
-  "activation_dropout": 0.055,
   "apply_spec_augment": true,
   "architectures": [
     "Wav2Vec2ForCTC"
   ],
-  "attention_dropout": 0.094,
   "bos_token_id": 1,
   "conv_bias": true,
   "conv_dim": [
@@ -36,22 +36,22 @@
     2
   ],
   "ctc_loss_reduction": "mean",
-  "ctc_zero_infinity": false,
   "do_stable_layer_norm": true,
   "eos_token_id": 2,
   "feat_extract_activation": "gelu",
   "feat_extract_dropout": 0.0,
   "feat_extract_norm": "layer",
-  "feat_proj_dropout": 0.04,
   "final_dropout": 0.0,
   "gradient_checkpointing": true,
   "hidden_act": "gelu",
-  "hidden_dropout": 0.047,
   "hidden_size": 1024,
   "initializer_range": 0.02,
   "intermediate_size": 4096,
   "layer_norm_eps": 1e-05,
-  "layerdrop": 0.041,
   "mask_channel_length": 10,
   "mask_channel_min_space": 1,
   "mask_channel_other": 0.0,
@@ -62,7 +62,7 @@
   "mask_time_length": 10,
   "mask_time_min_space": 1,
   "mask_time_other": 0.0,
-  "mask_time_prob": 0.082,
   "mask_time_selection": "static",
   "model_type": "wav2vec2",
   "num_attention_heads": 16,
@@ -70,7 +70,7 @@
   "num_conv_pos_embeddings": 128,
   "num_feat_extract_layers": 7,
   "num_hidden_layers": 24,
-  "pad_token_id": 41,
   "transformers_version": "4.4.0",
-  "vocab_size": 42
 }

 {
   "_name_or_path": "facebook/wav2vec2-large-xlsr-53",
+  "activation_dropout": 0.1,
   "apply_spec_augment": true,
   "architectures": [
     "Wav2Vec2ForCTC"
   ],
+  "attention_dropout": 0.1,
   "bos_token_id": 1,
   "conv_bias": true,
   "conv_dim": [
     2
   ],
   "ctc_loss_reduction": "mean",
+  "ctc_zero_infinity": true,
   "do_stable_layer_norm": true,
   "eos_token_id": 2,
   "feat_extract_activation": "gelu",
   "feat_extract_dropout": 0.0,
   "feat_extract_norm": "layer",
+  "feat_proj_dropout": 0.1,
   "final_dropout": 0.0,
   "gradient_checkpointing": true,
   "hidden_act": "gelu",
+  "hidden_dropout": 0.1,
   "hidden_size": 1024,
   "initializer_range": 0.02,
   "intermediate_size": 4096,
   "layer_norm_eps": 1e-05,
+  "layerdrop": 0.0,
   "mask_channel_length": 10,
   "mask_channel_min_space": 1,
   "mask_channel_other": 0.0,
   "mask_time_length": 10,
   "mask_time_min_space": 1,
   "mask_time_other": 0.0,
+  "mask_time_prob": 0.05,
   "mask_time_selection": "static",
   "model_type": "wav2vec2",
   "num_attention_heads": 16,
   "num_conv_pos_embeddings": 128,
   "num_feat_extract_layers": 7,
   "num_hidden_layers": 24,
+  "pad_token_id": 64,
   "transformers_version": "4.4.0",
+  "vocab_size": 65
 }

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4fd153384cafe5b830c62b09e80b7edcfbde38ad83f0f3b8de12de3fff2ec523
+size 1262200343

vocab.json CHANGED Viewed

@@ -1 +1 @@

- {"~~\u062a~~": 0, "~~\u0636~~": 1, "~~\u0648~~": ~~2, "\u062c":~~ 3, "~~\u0638~~": 4, "~~\u0622~~": 5, "~~\u0630~~": 6, "~~\u0639~~": 7, "~~\u0634~~": 8, "~~\u0644~~": 9, "~~\u0632~~": 10, "~~\u0621~~": 11, "~~\u0623~~": 12, "~~\u0637~~": 13, "~~\u0624~~": 14, "~~\u0642~~": 15, "~~\u062e~~": 16, "~~\u0628~~": 17, "~~\u064a~~": 18, "~~\u0645~~": 19, "~~\u0626~~": 20, "~~\u062b~~": 21, "~~\u0647~~": 22, "~~\u0643~~": 23, "~~\u06a9~~": 24, "~~\u062f~~": 25, "~~\u0631~~": 26, "~~\u062d~~": 27, "~~\u0646~~": 28, "~~\u0633~~": 29, "~~\u0625~~": 30, "~~\u06cc~~": 31, "~~\u0641~~": 32, "~~\u0629~~": 33, "~~\u0635~~": 34, "~~\u0627~~": 35, "~~\u0649~~": 36, "~~\u063a~~": 37, "~~\u0670~~": 38, "|": 39, "[UNK]": 40, "[PAD]": 41}

+ {"ا": 0, "_": 1, "ك": 3, "ن": 4, "@": 5, "ذ": 6, "ٖ": 7, "ش": 8, "غ": 9, "آ": 10, "ص": 11, "ي": 12, "ث": 13, "n": 14, "ج": 15, "d": 16, "ئ": 17, "ة": 18, "ه": 19, "ز": 20, "ع": 21, "ف": 22, "i": 23, "r": 24, "v": 25, "ڸ": 26, "k": 27, "ِ": 28, "ء": 29, "ر": 30, "s": 31, "t": 32, "ى": 33, "ـ": 34, " ": 35, "ؤ": 36, "ق": 37, "ض": 38, "م": 39, "ل": 40, "…": 41, "ط": 42, "ت": 43, "ّ": 44, "c": 45, "ظ": 46, "e": 47, "؟": 48, "h": 49, "ب": 50, "o": 51, "س": 52, "a": 53, "د": 54, "p": 55, "أ": 56, "ْ": 57, "\n": 58, "خ": 59, "ح": 60, "و": 61, "إ": 62, "|": 2, "[UNK]": 63, "[PAD]": 64}