YYYYYYibo
/

full_vanilla_dpo_iter_1

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

full_vanilla_dpo_iter_1

Commit History

DPO-7b-beta0.01

86dc6bd
verified

YYYYYYibo commited on Jul 2, 2024

Model save

5a6506d
verified

YYYYYYibo commited on Jul 2, 2024

Training in progress, step 150

3d1dfdf
verified

YYYYYYibo commited on Jul 2, 2024

Training in progress, step 100

15d45dc
verified

YYYYYYibo commited on Jul 2, 2024

Training in progress, step 50

7e8f6a0
verified

YYYYYYibo commited on Jul 2, 2024

initial commit

9ddc4ed
verified

YYYYYYibo commited on Jul 2, 2024