ericflo
/

Llama-3.1-8B-ContinuedTraining2-FFT

Text Generation

fill-in-the-middle

instruction-following

Inference Endpoints

Model card Files Files and versions Community

ericflo commited on Sep 12, 2024

Commit

3a21274

·

verified ·

1 Parent(s): b368b4e

Update README.md

Files changed (1) hide show

README.md +4 -4

README.md CHANGED Viewed

@@ -158,7 +158,7 @@ In this example, the model needs to understand and generate a coherent conversat
 ```bash
 python sft_14.py \
-    --run_name="llama3.1-8b-continued3" \
     --model_name_or_path="meta-llama/Meta-Llama-3.1-8B" \
     --dataset_name="mlfoundations/dclm-baseline-1.0-parquet,mlabonne/FineTome-100k" \
     --report_to="wandb" \
@@ -177,13 +177,13 @@ python sft_14.py \
     --logging_steps=1 \
     --num_train_epochs=1 \
     --push_to_hub \
-    --hub_model_id="ericflo/Llama-3.1-8B-ContinuedTraining3-FFT" \
     --hub_strategy="all_checkpoints" \
     --gradient_checkpointing \
     --use_liger=true \
     --packing=true \
     --torch_dtype="bfloat16" \
-    --output_dir="continuedtraining3_output"
 ```
 ## Intended Uses
@@ -210,4 +210,4 @@ This model is designed for:
 ## Contact
-For inquiries about this model, please contact Eric Florenzano through the [model repository](https://huggingface.co/ericflo/Llama-3.1-8B-ContinuedTraining3-FFT).

 ```bash
 python sft_14.py \
+    --run_name="llama3.1-8b-continued2" \
     --model_name_or_path="meta-llama/Meta-Llama-3.1-8B" \
     --dataset_name="mlfoundations/dclm-baseline-1.0-parquet,mlabonne/FineTome-100k" \
     --report_to="wandb" \
     --logging_steps=1 \
     --num_train_epochs=1 \
     --push_to_hub \
+    --hub_model_id="ericflo/Llama-3.1-8B-ContinuedTraining2-FFT" \
     --hub_strategy="all_checkpoints" \
     --gradient_checkpointing \
     --use_liger=true \
     --packing=true \
     --torch_dtype="bfloat16" \
+    --output_dir="continuedtraining2_output"
 ```
 ## Intended Uses
 ## Contact
+For inquiries about this model, please contact Eric Florenzano through the [model repository](https://huggingface.co/ericflo/Llama-3.1-8B-ContinuedTraining2-FFT).