Model save

Files changed (3) hide show

README.md CHANGED Viewed

@@ -36,15 +36,15 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 0.0002
-- train_batch_size: 2
 - eval_batch_size: 8
 - seed: 42
 - gradient_accumulation_steps: 4
-- total_train_batch_size: 8
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: constant
 - lr_scheduler_warmup_ratio: 0.03
-- num_epochs: 40
 - mixed_precision_training: Native AMP
 ### Training results

 The following hyperparameters were used during training:
 - learning_rate: 0.0002
+- train_batch_size: 4
 - eval_batch_size: 8
 - seed: 42
 - gradient_accumulation_steps: 4
+- total_train_batch_size: 16
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: constant
 - lr_scheduler_warmup_ratio: 0.03
+- num_epochs: 100
 - mixed_precision_training: Native AMP
 ### Training results

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:aae63fa9fbc86af30f7845e6ffc9d00dc8e2552138982207ce917abbf1e9add9
 size 73430448

 version https://git-lfs.github.com/spec/v1
+oid sha256:befc04acbedd1ce8775c7397ce823f9d89723f77d5264075bf95a9a87837d2e0
 size 73430448

runs/Oct22_23-17-53_b0ed59c0090a/events.out.tfevents.1729639110.b0ed59c0090a.1128.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:32858ec8004a7112a93ba592d34d7a28211abffb552091996dcd6322a8d38a86
-size 5441

 version https://git-lfs.github.com/spec/v1
+oid sha256:f81fd703baf96555ca52cd7471473bc1ad5b7b53f6317d2c9e72f7bf13755e4c
+size 5789