LLM-Alchemy-Chamber/mistral-instruct-generation

Browse files

Files changed (10) hide show

README.md +18 -18
adapter_config.json +3 -3
adapter_model.safetensors +1 -1
runs/Aug02_10-11-21_genertive-ai-workbench-0/events.out.tfevents.1722593484.genertive-ai-workbench-0.3881.0 +3 -0
runs/Aug02_15-08-44_genertive-ai-workbench-0/events.out.tfevents.1722611325.genertive-ai-workbench-0.348.0 +3 -0
runs/Aug03_05-27-29_genertive-ai-workbench-0/events.out.tfevents.1722662851.genertive-ai-workbench-0.302.0 +3 -0
runs/Aug03_05-48-06_genertive-ai-workbench-0/events.out.tfevents.1722664088.genertive-ai-workbench-0.828.0 +3 -0
runs/Aug03_06-43-15_genertive-ai-workbench-0/events.out.tfevents.1722667396.genertive-ai-workbench-0.1335.0 +3 -0
runs/Aug03_07-07-56_genertive-ai-workbench-0/events.out.tfevents.1722668878.genertive-ai-workbench-0.1753.0 +3 -0
training_args.bin +2 -2

README.md CHANGED Viewed

@@ -1,9 +1,9 @@
 ---
-license: apache-2.0
 library_name: peft
 tags:
 - generated_from_trainer
-base_model: mistralai/Mixtral-8x7B-v0.1
 model-index:
 - name: Mixtral_Alpace_v3
   results: []
@@ -16,7 +16,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [mistralai/Mixtral-8x7B-v0.1](https://huggingface.co/mistralai/Mixtral-8x7B-v0.1) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.7630
 ## Model description
@@ -36,34 +36,34 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 2.5e-05
-- train_batch_size: 10
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- lr_scheduler_warmup_steps: 0.03
 - training_steps: 100
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 0.9965        | 0.01  | 10   | 0.9608          |
-| 0.9611        | 0.02  | 20   | 0.9045          |
-| 0.8601        | 0.02  | 30   | 0.8574          |
-| 0.8382        | 0.03  | 40   | 0.8280          |
-| 0.8326        | 0.04  | 50   | 0.8072          |
-| 0.7815        | 0.05  | 60   | 0.7904          |
-| 0.796         | 0.06  | 70   | 0.7786          |
-| 0.7668        | 0.07  | 80   | 0.7701          |
-| 0.7774        | 0.07  | 90   | 0.7648          |
-| 0.7699        | 0.08  | 100  | 0.7630          |
 ### Framework versions
-- PEFT 0.9.1.dev0
 - Transformers 4.36.0
-- Pytorch 2.0.1+cu118
-- Datasets 2.18.0
 - Tokenizers 0.15.2

 ---
+base_model: mistralai/Mixtral-8x7B-v0.1
 library_name: peft
+license: apache-2.0
 tags:
 - generated_from_trainer
 model-index:
 - name: Mixtral_Alpace_v3
   results: []
 This model is a fine-tuned version of [mistralai/Mixtral-8x7B-v0.1](https://huggingface.co/mistralai/Mixtral-8x7B-v0.1) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.8517
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 2.5e-05
+- train_batch_size: 16
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- lr_scheduler_warmup_steps: 3
 - training_steps: 100
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 1.1536        | 0.03  | 10   | 1.1278          |
+| 1.0733        | 0.07  | 20   | 1.0587          |
+| 1.0201        | 0.1   | 30   | 0.9941          |
+| 0.9622        | 0.13  | 40   | 0.9509          |
+| 0.9268        | 0.16  | 50   | 0.9188          |
+| 0.8984        | 0.2   | 60   | 0.8944          |
+| 0.9067        | 0.23  | 70   | 0.8756          |
+| 0.8712        | 0.26  | 80   | 0.8622          |
+| 0.8485        | 0.3   | 90   | 0.8544          |
+| 0.8703        | 0.33  | 100  | 0.8517          |
 ### Framework versions
+- PEFT 0.12.1.dev0
 - Transformers 4.36.0
+- Pytorch 2.2.2+cu121
+- Datasets 2.20.0
 - Tokenizers 0.15.2

adapter_config.json CHANGED Viewed

@@ -20,13 +20,13 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
     "k_proj",
     "up_proj",
-    "q_proj",
     "o_proj",
     "down_proj",
-    "lm_head",
-    "v_proj",
     "gate_proj"
   ],
   "task_type": "CAUSAL_LM",

   "rank_pattern": {},
   "revision": null,
   "target_modules": [
+    "q_proj",
+    "lm_head",
     "k_proj",
     "up_proj",
+    "v_proj",
     "o_proj",
     "down_proj",
     "gate_proj"
   ],
   "task_type": "CAUSAL_LM",

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e6d7b3b0957ac0b7bf695d53bc989c422c608927ccd72d92de5ef0f8a27b7bb5
 size 751667752

 version https://git-lfs.github.com/spec/v1
+oid sha256:3526a823dd72bb5ec2d942eee6418113aa5d5e3c17dd3638798095c3c3c885da
 size 751667752

runs/Aug02_10-11-21_genertive-ai-workbench-0/events.out.tfevents.1722593484.genertive-ai-workbench-0.3881.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2e66034b28d67c32863719026eb1e3a397e23118c758c1f04cdc46ed7a8258be
+size 4892

runs/Aug02_15-08-44_genertive-ai-workbench-0/events.out.tfevents.1722611325.genertive-ai-workbench-0.348.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1ca87ca39caf5d5d1fb8517d71c2f3b57df47d0bcba347b75d19374fa0ca3f57
+size 4892

runs/Aug03_05-27-29_genertive-ai-workbench-0/events.out.tfevents.1722662851.genertive-ai-workbench-0.302.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0487daef055c7bd1247f0dbd61b872c4ac5392a4e94e857ec8a77dbed363b851
+size 4892

runs/Aug03_05-48-06_genertive-ai-workbench-0/events.out.tfevents.1722664088.genertive-ai-workbench-0.828.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7de4e7a40c0a7af8513a093b2d738dc6f8a407f668736094d594b4e73a0d1db4
+size 4892

runs/Aug03_06-43-15_genertive-ai-workbench-0/events.out.tfevents.1722667396.genertive-ai-workbench-0.1335.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f97e3d2bae844614c37b3748534afcf5b88ae5ed7b1d3792b15f3af4464feb18
+size 4889

runs/Aug03_07-07-56_genertive-ai-workbench-0/events.out.tfevents.1722668878.genertive-ai-workbench-0.1753.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c87cd6ad039415ad9823bafc50166fc37f55a9cb348458d19409295370dab761
+size 9437

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c954fb7eb42f3f555738afc9de64de8c969c8194d16790ace3d1f155aae492b9
-size 4283

 version https://git-lfs.github.com/spec/v1
+oid sha256:89f2f6393370d2e7fdd31fd6345d28030534c309c506d5df6df0daa02ea55bfe
+size 4728