wxzhang
/

dpo-selective-buffer-spo-shift

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

wxzhang commited on May 14, 2024

Commit

7f6a6b4

·

verified ·

1 Parent(s): 3530f90

Training in progress, step 1500

Files changed (0) hide show