alexredna
/

TinyLlama-1.1B-Chat-v1.0-reasoning-v2-dpo

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

TinyLlama-1.1B-Chat-v1.0-reasoning-v2-dpo / config.json

Commit History

Training in progress, step 300

55bf1eb

alexredna commited on Jan 7