etri-xainlp
/

llama2-12.8b_lora-dpo_v1

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

etri-xainlp commited on Jan 17

Commit

4d96e96

•

1 Parent(s): 3db1983

Update README.md

Files changed (1) hide show

README.md +18 -1

README.md CHANGED Viewed

@@ -4,5 +4,22 @@ license: apache-2.0
 # etri-xainlp/llama2-12.8b_lora-dpo_v1
-based [meta-llama/Llama-13b-hf](https://huggingface.co/meta-llama/Llama-2-13b-hf), instruction tuned(710k) and dpo(90k).

 # etri-xainlp/llama2-12.8b_lora-dpo_v1
+## Model Details
+**Model Developers** ETRI xainlp team
+**Input** text only.
+**Output** text only.
+**Model Architecture**
+**Base Model**  [meta-llama/Llama-13b-hf](https://huggingface.co/meta-llama/Llama-2-13b-hf)
+**Training Dataset**
+ - sft+lora: 710k instruction-following set
+ - dpo+lora: 90k user preference set
+ - We use A100 GPU 80GB * 8, when training.