LumiOpen
/

Poro-34B-chat-OpenAssistant

Model card Files Files and versions Community

laineyyy commited on about 1 month ago

Commit

9562e8f

·

verified ·

1 Parent(s): 882a4ee

Update README.md

Files changed (1) hide show

README.md +4 -0

README.md CHANGED Viewed

@@ -24,12 +24,16 @@ We use a curated subset of Open Assistant 2 and translated the dataset into Finn
 ### DPO
 - **English**: [HelpSteer2](https://huggingface.co/datasets/nvidia/HelpSteer2)
 - **Finnish**: TBA
 ## Recipes
 **SFT**
 ```

 ### DPO
+We use the HelpSteer2 preference binarized into chosen-rejected pairs using the helpfulness score as discussed in the [HelpSteer2](https://arxiv.org/abs/2406.08673) paper. We translated the dataset into Finnish using Poro.
 - **English**: [HelpSteer2](https://huggingface.co/datasets/nvidia/HelpSteer2)
 - **Finnish**: TBA
 ## Recipes
+We used 4 nodes (8 x AMD MI250X) to obtain a global batch size of 128 for SFT and 64 for DPO.
 **SFT**
 ```