Cartinoe5930
/

KoRAE-13b-DPO

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Cartinoe5930 commited on Dec 1, 2023

Commit

14fdbc6

·

1 Parent(s): d358026

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -35,7 +35,7 @@ For more details, please check the GitHub Repository!
 ## Training Details
 - **Hardward:** We utilized A100 80G for finetuning
-- **Training factors:** The [Transformers Trainer](https://huggingface.co/docs/transformers/main_classes/trainer) and [Huggingface PEFT](https://huggingface.co/docs/peft/index) were utilized for finetuning.
 - **Training Details:** DPO training 1 epoch on [ko_Ultrafeedback_binarized](https://huggingface.co/datasets/maywell/ko_Ultrafeedback_binarized) dataset. [KoRAE-13b](https://huggingface.co/Cartinoe5930/KoRAE-13b) model was used.
 For more details, please check the GitHub Repository!

 ## Training Details
 - **Hardward:** We utilized A100 80G for finetuning
+- **Training factors:** The [TRL DPOTrainer](https://huggingface.co/docs/trl/main/en/dpo_trainer) and [Huggingface PEFT](https://huggingface.co/docs/peft/index) were utilized for finetuning.
 - **Training Details:** DPO training 1 epoch on [ko_Ultrafeedback_binarized](https://huggingface.co/datasets/maywell/ko_Ultrafeedback_binarized) dataset. [KoRAE-13b](https://huggingface.co/Cartinoe5930/KoRAE-13b) model was used.
 For more details, please check the GitHub Repository!