shenxq
/

zephyr-7b-dpo-qlora-pairrm

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions Community

zephyr-7b-dpo-qlora-pairrm / training_args.bin

Commit History

Training in progress, step 100

951dac4
verified

shenxq commited on Mar 19

Training in progress, step 100

64c1231
verified

shenxq commited on Mar 18

Training in progress, step 100

b2e7f86
verified

shenxq commited on Mar 18