StefanKrsteski
/

Phi-3-mini-4k-instruct-DPO-EPFL

Model card Files Files and versions Community

StefanKrsteski commited on May 31

Commit

2aa575c

•

1 Parent(s): 5a5d35c

Update README.md

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -5,13 +5,13 @@ datasets:
 - argilla/ultrafeedback-binarized-preferences-cleaned
 - >-
   flax-sentence-embeddings/stackexchange_titlebody_best_and_down_voted_answer_jsonl
 ---
 # Model Card for Model ID
-<!-- Provide a quick summary of what the model is/does. -->
 ## Model Details

 - argilla/ultrafeedback-binarized-preferences-cleaned
 - >-
   flax-sentence-embeddings/stackexchange_titlebody_best_and_down_voted_answer_jsonl
+language:
+- en
 ---
 # Model Card for Model ID
+Phi-3-mini-4k-instruct aligned using trl DPO on three datasets: EPFL-MNLP course (not yet publicly available), stackexchange (STEM only) and ultrafeedback.
 ## Model Details