Saving train state of step 40000

Browse files

Files changed (16) hide show

checkpoint-40000-epoch-2/optimizer.bin +3 -0
checkpoint-40000-epoch-2/pytorch_model.bin +3 -0
checkpoint-40000-epoch-2/random_states_0.pkl +3 -0
checkpoint-40000-epoch-2/random_states_1.pkl +3 -0
checkpoint-40000-epoch-2/random_states_2.pkl +3 -0
checkpoint-40000-epoch-2/random_states_3.pkl +3 -0
checkpoint-40000-epoch-2/random_states_4.pkl +3 -0
checkpoint-40000-epoch-2/random_states_5.pkl +3 -0
checkpoint-40000-epoch-2/random_states_6.pkl +3 -0
checkpoint-40000-epoch-2/random_states_7.pkl +3 -0
checkpoint-40000-epoch-2/scheduler.bin +3 -0
parler_tts/__pycache__/configuration_parler_tts.cpython-311.pyc +0 -0
parler_tts/__pycache__/modeling_parler_tts.cpython-311.pyc +0 -0
slurm_job.slurm +0 -1
starting_point_0.01_rope.json +1 -2
training/eval.py +3 -2

checkpoint-40000-epoch-2/optimizer.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e6645d44abbc401e120be5dc489364dff46c6bef4899ce4edf1b0c09c10713aa
+size 3652769047

checkpoint-40000-epoch-2/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a44c145e06a274382225a36112ccf24aebd12c5e123c08ced3e7fc450ec1bda1
+size 2588465818

checkpoint-40000-epoch-2/random_states_0.pkl ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4373bcf5389516c60ce27ee2770f4273321a8a399b28157b0b7a6a88b36f769a
+size 16036

checkpoint-40000-epoch-2/random_states_1.pkl ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f652448236a57a3fce494feeaca0a3aeb1dfcfcefbf87bd8830d9a7431c8879f
+size 16036

checkpoint-40000-epoch-2/random_states_2.pkl ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f7e0c39e93d05b96ee155ed4077d16db98441d2d8d8c3ff1cadd9957c13c8d29
+size 16036

checkpoint-40000-epoch-2/random_states_3.pkl ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1bf9eeeb4068d4f97ea9936d7f134238a8f1c6b55e04251765e5e949cb98847c
+size 16100

checkpoint-40000-epoch-2/random_states_4.pkl ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:def78a5322574acc6ada55a74473298a7ab0defa21ed086ebc32a7f541f4727a
+size 16100

checkpoint-40000-epoch-2/random_states_5.pkl ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:924d3701abf0ada3e0e8ebcd9b67e3a691c4d583480e8738584a24d86fcfb2d8
+size 16100

checkpoint-40000-epoch-2/random_states_6.pkl ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5ebd276339b71cac4a7347c4cbdce6537168ec50f1748b252d1e8e9f91639bf5
+size 16100

checkpoint-40000-epoch-2/random_states_7.pkl ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f9d13afe0f590dbbe29711ec15cbb9db7c54976da83b02bcc42d31b53b37230f
+size 16100

checkpoint-40000-epoch-2/scheduler.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:93769288743218b7e58d6c9be3f8385f45d0347b2a28d09b0fbf0b28704da6e6
+size 1000

parler_tts/__pycache__/configuration_parler_tts.cpython-311.pyc CHANGED Viewed

Binary files a/parler_tts/__pycache__/configuration_parler_tts.cpython-311.pyc and b/parler_tts/__pycache__/configuration_parler_tts.cpython-311.pyc differ

parler_tts/__pycache__/modeling_parler_tts.cpython-311.pyc CHANGED Viewed

Binary files a/parler_tts/__pycache__/modeling_parler_tts.cpython-311.pyc and b/parler_tts/__pycache__/modeling_parler_tts.cpython-311.pyc differ

slurm_job.slurm CHANGED Viewed

@@ -2,7 +2,6 @@
 #SBATCH --job-name=parler-tts
 #SBATCH --nodes=1
 # set 48h for job wall time limit
-#SBATCH --requeue
 #SBATCH --time=48:00:00
 #SBATCH --ntasks-per-node=1          # crucial - only 1 task per dist per node!
 #SBATCH --cpus-per-task=32

 #SBATCH --job-name=parler-tts
 #SBATCH --nodes=1
 # set 48h for job wall time limit
 #SBATCH --time=48:00:00
 #SBATCH --ntasks-per-node=1          # crucial - only 1 task per dist per node!
 #SBATCH --cpus-per-task=32

starting_point_0.01_rope.json CHANGED Viewed

@@ -1,9 +1,8 @@
 {
     "model_name_or_path": "parler-tts/parler-tts-untrained-600M-cross-attention-rope",
-    "save_to_disk":  "/scratch/tmp_dataset_audio/",
     "temporary_save_to_disk": "/scratch/tmp_dataset_audio/",
     "push_to_hub": true,
-    "cache_dir": "/scratch/cache",
     "feature_extractor_name":"ylacombe/dac_44khZ_8kbps",

 {
     "model_name_or_path": "parler-tts/parler-tts-untrained-600M-cross-attention-rope",
+    "save_to_disk":  "/fsx/yoach/tmp/artefacts/10k_hours_processed_punctuated/",
     "temporary_save_to_disk": "/scratch/tmp_dataset_audio/",
     "push_to_hub": true,
     "feature_extractor_name":"ylacombe/dac_44khZ_8kbps",

training/eval.py CHANGED Viewed

@@ -47,12 +47,13 @@ def wer(asr_model_name_or_path, prompts, audios, device, per_device_eval_batch_s
     normalized_references = []
     for pred, ref in zip(transcriptions, prompts):
-        normalizer = english_normalizer if hasattr(pred, "language") and pred["language"] == "english" else basic_normalizer
         norm_ref = normalizer(ref)
         if len(norm_ref) > 0:
             norm_pred = normalizer(pred["text"])
             normalized_predictions.append(norm_pred)
-            normalized_references.append(norm_pred)
     word_error = 100 * metric.compute(predictions=normalized_predictions, references=normalized_references)

     normalized_references = []
     for pred, ref in zip(transcriptions, prompts):
+        normalizer = english_normalizer
         norm_ref = normalizer(ref)
         if len(norm_ref) > 0:
             norm_pred = normalizer(pred["text"])
             normalized_predictions.append(norm_pred)
+            normalized_references.append(norm_ref)
     word_error = 100 * metric.compute(predictions=normalized_predictions, references=normalized_references)