Upload with huggingface_hub

Browse files

Files changed (8) hide show

config.json +129 -0
optimizer.pt +3 -0
preprocessor_config.json +9 -0
pytorch_model.bin +3 -0
rng_state.pth +3 -0
scheduler.pt +3 -0
trainer_state.json +493 -0
training_args.bin +3 -0

config.json ADDED Viewed

	@@ -0,0 +1,129 @@

+{
+  "_name_or_path": "facebook/wav2vec2-base",
+  "activation_dropout": 0.0,
+  "adapter_kernel_size": 3,
+  "adapter_stride": 2,
+  "add_adapter": false,
+  "apply_spec_augment": true,
+  "architectures": [
+    "Wav2Vec2ForSequenceClassification"
+  ],
+  "attention_dropout": 0.1,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "codevector_dim": 256,
+  "contrastive_logits_temperature": 0.1,
+  "conv_bias": false,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "sum",
+  "ctc_zero_infinity": false,
+  "diversity_loss_weight": 0.1,
+  "do_stable_layer_norm": false,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_norm": "group",
+  "feat_proj_dropout": 0.1,
+  "feat_quantizer_dropout": 0.0,
+  "final_dropout": 0.0,
+  "freeze_feat_extract_train": true,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "door_close",
+    "1": "door_open",
+    "2": "door_stop",
+    "3": "unknown"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "door_close": "0",
+    "door_open": "1",
+    "door_stop": "2",
+    "unknown": "3"
+  },
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.0,
+  "mask_channel_length": 10,
+  "mask_channel_min_space": 1,
+  "mask_channel_other": 0.0,
+  "mask_channel_prob": 0.0,
+  "mask_channel_selection": "static",
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_min_space": 1,
+  "mask_time_other": 0.0,
+  "mask_time_prob": 0.05,
+  "mask_time_selection": "static",
+  "model_type": "wav2vec2",
+  "no_mask_channel_overlap": false,
+  "no_mask_time_overlap": false,
+  "num_adapter_layers": 3,
+  "num_attention_heads": 12,
+  "num_codevector_groups": 2,
+  "num_codevectors_per_group": 320,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 12,
+  "num_negatives": 100,
+  "output_hidden_size": 768,
+  "pad_token_id": 0,
+  "proj_codevector_dim": 256,
+  "tdnn_dilation": [
+    1,
+    2,
+    3,
+    1,
+    1
+  ],
+  "tdnn_dim": [
+    512,
+    512,
+    512,
+    512,
+    1500
+  ],
+  "tdnn_kernel": [
+    5,
+    3,
+    3,
+    1,
+    1
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.27.4",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 32,
+  "xvector_output_dim": 512
+}

optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7587ffff1dfe24aa849f7eeb0c52aaf3dfbacbbc3f6602e8c55195a6717d1538
+size 756681573

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "return_attention_mask": false,
+  "sampling_rate": 16000
+}

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:256a577ac8c6f7f70b6a4c6d33bd866f83728f944e2d8e3e2c681a970ccba294
+size 378350611

rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cf446337cb7e8c908e927cd6898981bf25871364c58e8cb1d6de5544592f9d8e
+size 14567

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7ee1f7050eaf838661ad94fdb4437c7f87c549b7fc38e49c89bd120f7dea84f0
+size 623

trainer_state.json ADDED Viewed

	@@ -0,0 +1,493 @@

+{
+  "best_metric": 0.9901107169730194,
+  "best_model_checkpoint": "wav2vec2-base-finetuned-doorbot/checkpoint-725",
+  "epoch": 4.982817869415808,
+  "global_step": 725,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.07,
+      "learning_rate": 4.10958904109589e-06,
+      "loss": 1.369,
+      "step": 10
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 8.21917808219178e-06,
+      "loss": 1.3239,
+      "step": 20
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 1.2328767123287671e-05,
+      "loss": 1.2559,
+      "step": 30
+    },
+    {
+      "epoch": 0.27,
+      "learning_rate": 1.643835616438356e-05,
+      "loss": 1.1835,
+      "step": 40
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 2.0547945205479453e-05,
+      "loss": 1.0583,
+      "step": 50
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 2.4657534246575342e-05,
+      "loss": 1.0132,
+      "step": 60
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 2.876712328767123e-05,
+      "loss": 0.8901,
+      "step": 70
+    },
+    {
+      "epoch": 0.55,
+      "learning_rate": 2.9677914110429448e-05,
+      "loss": 0.7815,
+      "step": 80
+    },
+    {
+      "epoch": 0.62,
+      "learning_rate": 2.9217791411042947e-05,
+      "loss": 0.6855,
+      "step": 90
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 2.8757668711656442e-05,
+      "loss": 0.5417,
+      "step": 100
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 2.829754601226994e-05,
+      "loss": 0.4626,
+      "step": 110
+    },
+    {
+      "epoch": 0.82,
+      "learning_rate": 2.7837423312883435e-05,
+      "loss": 0.4475,
+      "step": 120
+    },
+    {
+      "epoch": 0.89,
+      "learning_rate": 2.737730061349693e-05,
+      "loss": 0.375,
+      "step": 130
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 2.6917177914110432e-05,
+      "loss": 0.3422,
+      "step": 140
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.9508760614855423,
+      "eval_loss": 0.2727504074573517,
+      "eval_runtime": 101.1131,
+      "eval_samples_per_second": 92.006,
+      "eval_steps_per_second": 2.878,
+      "step": 145
+    },
+    {
+      "epoch": 1.03,
+      "learning_rate": 2.6457055214723928e-05,
+      "loss": 0.3256,
+      "step": 150
+    },
+    {
+      "epoch": 1.1,
+      "learning_rate": 2.5996932515337423e-05,
+      "loss": 0.2889,
+      "step": 160
+    },
+    {
+      "epoch": 1.17,
+      "learning_rate": 2.553680981595092e-05,
+      "loss": 0.2608,
+      "step": 170
+    },
+    {
+      "epoch": 1.24,
+      "learning_rate": 2.5076687116564416e-05,
+      "loss": 0.2261,
+      "step": 180
+    },
+    {
+      "epoch": 1.31,
+      "learning_rate": 2.4616564417177915e-05,
+      "loss": 0.1831,
+      "step": 190
+    },
+    {
+      "epoch": 1.37,
+      "learning_rate": 2.4156441717791413e-05,
+      "loss": 0.178,
+      "step": 200
+    },
+    {
+      "epoch": 1.44,
+      "learning_rate": 2.369631901840491e-05,
+      "loss": 0.1697,
+      "step": 210
+    },
+    {
+      "epoch": 1.51,
+      "learning_rate": 2.3236196319018404e-05,
+      "loss": 0.1918,
+      "step": 220
+    },
+    {
+      "epoch": 1.58,
+      "learning_rate": 2.2776073619631902e-05,
+      "loss": 0.1838,
+      "step": 230
+    },
+    {
+      "epoch": 1.65,
+      "learning_rate": 2.23159509202454e-05,
+      "loss": 0.1839,
+      "step": 240
+    },
+    {
+      "epoch": 1.72,
+      "learning_rate": 2.1855828220858896e-05,
+      "loss": 0.1522,
+      "step": 250
+    },
+    {
+      "epoch": 1.79,
+      "learning_rate": 2.1395705521472395e-05,
+      "loss": 0.1487,
+      "step": 260
+    },
+    {
+      "epoch": 1.86,
+      "learning_rate": 2.093558282208589e-05,
+      "loss": 0.1389,
+      "step": 270
+    },
+    {
+      "epoch": 1.92,
+      "learning_rate": 2.0475460122699385e-05,
+      "loss": 0.1334,
+      "step": 280
+    },
+    {
+      "epoch": 1.99,
+      "learning_rate": 2.0015337423312883e-05,
+      "loss": 0.1201,
+      "step": 290
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.9834462001504891,
+      "eval_loss": 0.09842008352279663,
+      "eval_runtime": 100.3887,
+      "eval_samples_per_second": 92.67,
+      "eval_steps_per_second": 2.899,
+      "step": 291
+    },
+    {
+      "epoch": 2.06,
+      "learning_rate": 1.9555214723926382e-05,
+      "loss": 0.1195,
+      "step": 300
+    },
+    {
+      "epoch": 2.13,
+      "learning_rate": 1.9095092024539877e-05,
+      "loss": 0.1137,
+      "step": 310
+    },
+    {
+      "epoch": 2.2,
+      "learning_rate": 1.8634969325153372e-05,
+      "loss": 0.1058,
+      "step": 320
+    },
+    {
+      "epoch": 2.27,
+      "learning_rate": 1.8174846625766874e-05,
+      "loss": 0.1208,
+      "step": 330
+    },
+    {
+      "epoch": 2.34,
+      "learning_rate": 1.771472392638037e-05,
+      "loss": 0.1067,
+      "step": 340
+    },
+    {
+      "epoch": 2.41,
+      "learning_rate": 1.7254601226993864e-05,
+      "loss": 0.0979,
+      "step": 350
+    },
+    {
+      "epoch": 2.47,
+      "learning_rate": 1.6794478527607363e-05,
+      "loss": 0.1151,
+      "step": 360
+    },
+    {
+      "epoch": 2.54,
+      "learning_rate": 1.6334355828220858e-05,
+      "loss": 0.1143,
+      "step": 370
+    },
+    {
+      "epoch": 2.61,
+      "learning_rate": 1.5874233128834357e-05,
+      "loss": 0.1025,
+      "step": 380
+    },
+    {
+      "epoch": 2.68,
+      "learning_rate": 1.5414110429447855e-05,
+      "loss": 0.0852,
+      "step": 390
+    },
+    {
+      "epoch": 2.75,
+      "learning_rate": 1.495398773006135e-05,
+      "loss": 0.0908,
+      "step": 400
+    },
+    {
+      "epoch": 2.82,
+      "learning_rate": 1.4493865030674847e-05,
+      "loss": 0.0992,
+      "step": 410
+    },
+    {
+      "epoch": 2.89,
+      "learning_rate": 1.4033742331288344e-05,
+      "loss": 0.0869,
+      "step": 420
+    },
+    {
+      "epoch": 2.96,
+      "learning_rate": 1.357361963190184e-05,
+      "loss": 0.0867,
+      "step": 430
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.9893582715253144,
+      "eval_loss": 0.058089084923267365,
+      "eval_runtime": 100.4678,
+      "eval_samples_per_second": 92.597,
+      "eval_steps_per_second": 2.896,
+      "step": 436
+    },
+    {
+      "epoch": 3.02,
+      "learning_rate": 1.3113496932515338e-05,
+      "loss": 0.096,
+      "step": 440
+    },
+    {
+      "epoch": 3.09,
+      "learning_rate": 1.2653374233128834e-05,
+      "loss": 0.0985,
+      "step": 450
+    },
+    {
+      "epoch": 3.16,
+      "learning_rate": 1.2193251533742331e-05,
+      "loss": 0.0964,
+      "step": 460
+    },
+    {
+      "epoch": 3.23,
+      "learning_rate": 1.173312883435583e-05,
+      "loss": 0.0804,
+      "step": 470
+    },
+    {
+      "epoch": 3.3,
+      "learning_rate": 1.1273006134969325e-05,
+      "loss": 0.0762,
+      "step": 480
+    },
+    {
+      "epoch": 3.37,
+      "learning_rate": 1.0812883435582822e-05,
+      "loss": 0.0645,
+      "step": 490
+    },
+    {
+      "epoch": 3.44,
+      "learning_rate": 1.035276073619632e-05,
+      "loss": 0.0685,
+      "step": 500
+    },
+    {
+      "epoch": 3.51,
+      "learning_rate": 9.892638036809815e-06,
+      "loss": 0.0703,
+      "step": 510
+    },
+    {
+      "epoch": 3.57,
+      "learning_rate": 9.432515337423314e-06,
+      "loss": 0.0753,
+      "step": 520
+    },
+    {
+      "epoch": 3.64,
+      "learning_rate": 8.972392638036809e-06,
+      "loss": 0.0652,
+      "step": 530
+    },
+    {
+      "epoch": 3.71,
+      "learning_rate": 8.512269938650308e-06,
+      "loss": 0.0571,
+      "step": 540
+    },
+    {
+      "epoch": 3.78,
+      "learning_rate": 8.052147239263804e-06,
+      "loss": 0.0707,
+      "step": 550
+    },
+    {
+      "epoch": 3.85,
+      "learning_rate": 7.5920245398773005e-06,
+      "loss": 0.0729,
+      "step": 560
+    },
+    {
+      "epoch": 3.92,
+      "learning_rate": 7.131901840490797e-06,
+      "loss": 0.0659,
+      "step": 570
+    },
+    {
+      "epoch": 3.99,
+      "learning_rate": 6.671779141104294e-06,
+      "loss": 0.0569,
+      "step": 580
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.9876383962162744,
+      "eval_loss": 0.055703163146972656,
+      "eval_runtime": 100.1804,
+      "eval_samples_per_second": 92.862,
+      "eval_steps_per_second": 2.905,
+      "step": 582
+    },
+    {
+      "epoch": 4.05,
+      "learning_rate": 6.211656441717792e-06,
+      "loss": 0.0516,
+      "step": 590
+    },
+    {
+      "epoch": 4.12,
+      "learning_rate": 5.751533742331289e-06,
+      "loss": 0.0431,
+      "step": 600
+    },
+    {
+      "epoch": 4.19,
+      "learning_rate": 5.2914110429447855e-06,
+      "loss": 0.0572,
+      "step": 610
+    },
+    {
+      "epoch": 4.26,
+      "learning_rate": 4.8312883435582815e-06,
+      "loss": 0.0553,
+      "step": 620
+    },
+    {
+      "epoch": 4.33,
+      "learning_rate": 4.371165644171779e-06,
+      "loss": 0.0657,
+      "step": 630
+    },
+    {
+      "epoch": 4.4,
+      "learning_rate": 3.911042944785276e-06,
+      "loss": 0.0564,
+      "step": 640
+    },
+    {
+      "epoch": 4.47,
+      "learning_rate": 3.4509202453987733e-06,
+      "loss": 0.0397,
+      "step": 650
+    },
+    {
+      "epoch": 4.54,
+      "learning_rate": 2.9907975460122697e-06,
+      "loss": 0.0692,
+      "step": 660
+    },
+    {
+      "epoch": 4.6,
+      "learning_rate": 2.530674846625767e-06,
+      "loss": 0.0514,
+      "step": 670
+    },
+    {
+      "epoch": 4.67,
+      "learning_rate": 2.070552147239264e-06,
+      "loss": 0.0573,
+      "step": 680
+    },
+    {
+      "epoch": 4.74,
+      "learning_rate": 1.6104294478527609e-06,
+      "loss": 0.0495,
+      "step": 690
+    },
+    {
+      "epoch": 4.81,
+      "learning_rate": 1.1503067484662577e-06,
+      "loss": 0.0516,
+      "step": 700
+    },
+    {
+      "epoch": 4.88,
+      "learning_rate": 6.901840490797546e-07,
+      "loss": 0.0475,
+      "step": 710
+    },
+    {
+      "epoch": 4.95,
+      "learning_rate": 2.3006134969325153e-07,
+      "loss": 0.0482,
+      "step": 720
+    },
+    {
+      "epoch": 4.98,
+      "eval_accuracy": 0.9901107169730194,
+      "eval_loss": 0.045827679336071014,
+      "eval_runtime": 100.8088,
+      "eval_samples_per_second": 92.284,
+      "eval_steps_per_second": 2.887,
+      "step": 725
+    }
+  ],
+  "max_steps": 725,
+  "num_train_epochs": 5,
+  "total_flos": 8.41884337740288e+17,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:619da0c48946e280f6bb6d4feabe8e0ef5740eb4a2095688deaff22ec38accdb
+size 3567