PKU-Alignment
/

beaver-7b-v1.0-reward

Reinforcement Learning

reinforcement-learning-from-human-feedback

Model card Files Files and versions Community

beaver-7b-v1.0-reward / README.md

RuiyangSun's picture

initial commit

7fae170 over 1 year ago

|

28 Bytes

	---
	license: apache-2.0
	---