sanduntg
/

output

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

output / runs

1 contributor

History: 2 commits

sanduntg's picture

sanduntg/llama_2_dpo_with_reward_1000

27e25fd verified 10 months ago