sergiopaniego
/

smolvlm-instruct-trl-dpo-rlaif-v

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

smolvlm-instruct-trl-dpo-rlaif-v / README.md

Commit History

Update README.md

320149a
verified

sergiopaniego commited on Dec 16, 2024

Model save

bd8694e
verified

sergiopaniego commited on Dec 10, 2024

Model save

255a608
verified

sergiopaniego commited on Dec 10, 2024