burtenshaw
/

Qwen1.5-0.5B-dpo-mix-7k-3000

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen1.5-0.5B-dpo-mix-7k-3000 / trl

1 contributor

History: 1 commit

burtenshaw's picture

burtenshaw HF staff

Upload folder using huggingface_hub

4ad32d0 verified 9 months ago

test_orpo_trainer_demo.py

4.48 kB

Upload folder using huggingface_hub 9 months ago