tangledgroup
/

tangled-llama-i-128k-v0.1

Text Generation

Inference Endpoints

Model card Files Files and versions Community

mtasic85 commited on 5 days ago

Commit

15b659d

•

1 Parent(s): a1af5c6

sophia_opt.SophiaG

Files changed (1) hide show

scripts/pretrain-model.yaml +1 -1

scripts/pretrain-model.yaml CHANGED Viewed

@@ -71,7 +71,7 @@ train:
   micro_batch_size: 2
   # Number of iterations with learning rate warmup active (type: int, default: 2000)
-  lr_warmup_steps: 2000
   # Number of epochs to train on (type: Optional[int], default: null)
   epochs:

   micro_batch_size: 2
   # Number of iterations with learning rate warmup active (type: int, default: 2000)
+  lr_warmup_steps: 0
   # Number of epochs to train on (type: Optional[int], default: null)
   epochs: