bikalnetomi
/

RLHF-PPO-PPOModel-LLama3-1B-v1.0

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

RLHF-PPO-PPOModel-LLama3-1B-v1.0 / .gitattributes

Commit History

End of training

b60abfe
verified

bikalnetomi commited on 24 days ago

initial commit

936a7ad
verified

bikalnetomi commited on 24 days ago