two

Files changed (6) hide show

.gitattributes CHANGED Viewed

@@ -33,3 +33,10 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+training_log.json filter=lfs diff=lfs merge=lfs -text
+training_parameters.json filter=lfs diff=lfs merge=lfs -text
+training_prompt.json filter=lfs diff=lfs merge=lfs -text
+README.md filter=lfs diff=lfs merge=lfs -text
+adapter_config.json filter=lfs diff=lfs merge=lfs -text
+adapter_model.safetensors filter=lfs diff=lfs merge=lfs -text
+runs filter=lfs diff=lfs merge=lfs -text

README.md CHANGED Viewed

@@ -1,3 +1,3 @@
----
-license: apache-2.0
----

+version https://git-lfs.github.com/spec/v1
+oid sha256:98b45ea81164d1e1a1dd82255207053b15cd6c69d922a1c5cf3387ce604d4b74
+size 28

adapter_config.json CHANGED Viewed

@@ -1,31 +1,3 @@
-{
-  "alpha_pattern": {},
-  "auto_mapping": null,
-  "base_model_name_or_path": "models/TheBloke_speechless-mistral-dolphin-orca-platypus-samantha-7B-GPTQ",
-  "bias": "none",
-  "fan_in_fan_out": false,
-  "inference_mode": true,
-  "init_lora_weights": true,
-  "layers_pattern": null,
-  "layers_to_transform": null,
-  "loftq_config": {},
-  "lora_alpha": 64,
-  "lora_dropout": 0.05,
-  "megatron_config": null,
-  "megatron_core": "megatron.core",
-  "modules_to_save": null,
-  "peft_type": "LORA",
-  "r": 32,
-  "rank_pattern": {},
-  "revision": null,
-  "target_modules": [
-    "down_proj",
-    "o_proj",
-    "k_proj",
-    "q_proj",
-    "up_proj",
-    "v_proj",
-    "gate_proj"
-  ],
-  "task_type": "CAUSAL_LM"
-}

+version https://git-lfs.github.com/spec/v1
+oid sha256:2365a8875421a2e108fc0f2c201e7772bc8c27a4ec3d0a1aa01325e4984097c2
+size 703

training_log.json CHANGED Viewed

@@ -1,16 +1,3 @@
-{
-  "base_model_name": "TheBloke_speechless-mistral-dolphin-orca-platypus-samantha-7B-GPTQ",
-  "base_model_class": "MistralForCausalLM",
-  "base_loaded_in_4bit": false,
-  "base_loaded_in_8bit": false,
-  "projections": "gate, down, up, q, v, k, o",
-  "train_runtime": 504.3907,
-  "train_samples_per_second": 19.826,
-  "train_steps_per_second": 0.099,
-  "total_flos": 2115741155328000.0,
-  "train_loss": 4.443607044219971,
-  "epoch": 32.0,
-  "current_steps": 1585,
-  "loss": 4.0742,
-  "learning_rate": 0.0
-}

+version https://git-lfs.github.com/spec/v1
+oid sha256:ceb2ef2aadfbbf6eaf78281da4a97672219b5a9247f3445ce2ed3bc4da17864b
+size 505

training_parameters.json CHANGED Viewed

@@ -1,37 +1,3 @@
-{
-  "lora_name": "50-elijah-2",
-  "always_override": false,
-  "q_proj_en": true,
-  "v_proj_en": true,
-  "k_proj_en": true,
-  "o_proj_en": true,
-  "gate_proj_en": true,
-  "down_proj_en": true,
-  "up_proj_en": true,
-  "save_steps": 0.0,
-  "micro_batch_size": 4,
-  "batch_size": 128,
-  "epochs": 50.0,
-  "learning_rate": "3e-4",
-  "lr_scheduler_type": "linear",
-  "lora_rank": 32,
-  "lora_alpha": 64,
-  "lora_dropout": 0.05,
-  "cutoff_len": 256,
-  "dataset": "None",
-  "eval_dataset": "None",
-  "format": "None",
-  "eval_steps": 100.0,
-  "raw_text_file": "50-elijah",
-  "overlap_len": 128,
-  "newline_favor_len": 128,
-  "higher_rank_limit": false,
-  "warmup_steps": 100.0,
-  "optimizer": "adamw_torch",
-  "hard_cut_string": "\\n\\n",
-  "train_only_after": "",
-  "stop_at_loss": 0,
-  "add_eos_token": false,
-  "min_chars": 0.0,
-  "report_to": "None"
-}

+version https://git-lfs.github.com/spec/v1
+oid sha256:082d7caa0b6e26a4cf6a13d9beca159e92a0d52abc34e07535c7d147964e63ba
+size 847

training_prompt.json CHANGED Viewed

@@ -1,3 +1,3 @@
-{
-  "template_type": "raw_text"
-}

+version https://git-lfs.github.com/spec/v1
+oid sha256:f9fe797a498b6def105ea1e70735d61009194922c5ab5e0a74a2e427797a5e75
+size 33