distily
/

distily_profile_smollm

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

distily_profile_smollm / logs

1 contributor

History: 18 commits

lapp0's picture

Training in progress, step 20000

8336248 verified 3 months ago

attn_projector=mlp, per_device_train_batch_size=16, run_name=baseline
Training in progress, step 5000 3 months ago
attn_projector=mlp, per_device_train_batch_size=2, run_name=bs2
Training in progress, step 45000 3 months ago
attn_projector=mlp, per_device_train_batch_size=2, run_name=bs2_liger, student_model_use_liger=True
Training in progress, step 5000 3 months ago
attn_projector=mlp, per_device_train_batch_size=4, run_name=bs4
Training in progress, step 5000 3 months ago
attn_projector=mlp, per_device_train_batch_size=8, run_name=bs8
Training in progress, step 5000 3 months ago
attn_weight=0.0, per_device_train_batch_size=4, run_name=bs4_NO_liger_baseline, student_model_use_liger=False
Training in progress, step 20000 3 months ago
attn_weight=0.0, per_device_train_batch_size=4, run_name=bs4_NO_liger_baseline, student_model_use_liger=True
Training in progress, step 5000 3 months ago
attn_weight=0.0, per_device_train_batch_size=4, run_name=logits_only_bs4_liger, student_model_use_liger=True
Training in progress, step 5000 3 months ago