ShenaoZ
/

0.0_idpo_same_3iters_debug_iter_1

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

0.0_idpo_same_3iters_debug_iter_1

Commit History

End of training

6ff2111
verified

ShenaoZ commited on Apr 14

Model save

297b8ec
verified

ShenaoZ commited on Apr 14

Training in progress, step 100

1012d22
verified

ShenaoZ commited on Apr 14

initial commit

27992c8
verified

ShenaoZ commited on Apr 13