zkshan2002
/

RewardModel-uf-llama3.2-1B-OpenRLHF

Model card Files Files and versions Community

zkshan2002 commited on Oct 24

Commit

fc742d5

•

1 Parent(s): 336ea45

Create README.md

Files changed (1) hide show

README.md +6 -0

README.md ADDED Viewed

	@@ -0,0 +1,6 @@

+---
+datasets:
+- HuggingFaceH4/ultrafeedback_binarized
+base_model:
+- unsloth/Llama-3.2-1B-Instruct
+---