PKU-Alignment
/

beaver-7b-v1.0-cost

Reinforcement Learning

reinforcement-learning-from-human-feedback

Model card Files Files and versions Community

beaver-7b-v1.0-cost

2 contributors

History: 2 commits

RuiyangSun's picture

hello beaver cost model

cf8170f about 1 year ago