PKU-Alignment
/

beaver-7b-v1.0-reward

Reinforcement Learning

reinforcement-learning-from-human-feedback

Model card Files Files and versions Community

Resources

View closed (1)

Example Code Doesn't Work

#1 opened about 1 year ago by