Dev-SriramB/qa_final

Files changed (11) hide show

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [TheBloke/Mistral-7B-Instruct-v0.2-GPTQ](https://huggingface.co/TheBloke/Mistral-7B-Instruct-v0.2-GPTQ) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 2.0784
 ## Model description
@@ -44,15 +44,20 @@ The following hyperparameters were used during training:
 - optimizer: Use OptimizerNames.PAGED_ADAMW_8BIT with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 2
-- num_epochs: 2
 - mixed_precision_training: Native AMP
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 10.1116       | 1.0   | 25   | 2.2149          |
-| 8.6814        | 2.0   | 50   | 2.0784          |
 ### Framework versions

 This model is a fine-tuned version of [TheBloke/Mistral-7B-Instruct-v0.2-GPTQ](https://huggingface.co/TheBloke/Mistral-7B-Instruct-v0.2-GPTQ) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 1.2620
 ## Model description
 - optimizer: Use OptimizerNames.PAGED_ADAMW_8BIT with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 2
+- num_epochs: 7
 - mixed_precision_training: Native AMP
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 10.0354       | 1.0   | 25   | 2.1524          |
+| 8.0146        | 2.0   | 50   | 1.7660          |
+| 6.243         | 3.0   | 75   | 1.3734          |
+| 5.268         | 4.0   | 100  | 1.2929          |
+| 5.0111        | 5.0   | 125  | 1.2709          |
+| 4.8748        | 6.0   | 150  | 1.2624          |
+| 4.8125        | 7.0   | 175  | 1.2620          |
 ### Framework versions

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:23ce61ead5d7b31bf2178da17ab221af8d36af442e1ae5a91364249e137dd0b2
 size 27280152

 version https://git-lfs.github.com/spec/v1
+oid sha256:e06b90827d092941ed0a4801a5ff3d4c3a30127ab67382d97a2e5918f13af9c2
 size 27280152

runs/Feb01_13-32-40_a4f1e2d90e92/events.out.tfevents.1738416767.a4f1e2d90e92.272.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:333d8c9b884a539ba5f72a7edcc02d6c16a5b77b2500e8745c988ad98c240765
+size 5725

runs/Feb01_13-36-15_a4f1e2d90e92/events.out.tfevents.1738416978.a4f1e2d90e92.272.1 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:fc570bac250a20f95d719c6b37d1534920af03882764b4efe985cda9e0d64943
+size 5725

runs/Feb01_13-36-32_a4f1e2d90e92/events.out.tfevents.1738416998.a4f1e2d90e92.272.2 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:5431e4722316a0d8c2c6881e2c9ae10be8b1cbe5a6ab67144ab43d830fd6775f
+size 5725

runs/Feb01_13-38-35_a4f1e2d90e92/events.out.tfevents.1738417117.a4f1e2d90e92.272.3 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:97fdcc86fead4ed1a6b069e51d9d9083cef65105148602640d04ead83dcaff22
+size 5725

runs/Feb01_13-38-49_a4f1e2d90e92/events.out.tfevents.1738417131.a4f1e2d90e92.272.4 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:b0306081894f0203beb8b9985b34361fee6a6654109204eac5de01472f9fd7b7
+size 5725

runs/Feb01_13-40-45_a4f1e2d90e92/events.out.tfevents.1738417247.a4f1e2d90e92.272.5 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:38cdb9eb2b439982ef7da43c7b20435a5e00080306ffa72985232580f490a459
+size 5725

runs/Feb01_13-41-22_a4f1e2d90e92/events.out.tfevents.1738417285.a4f1e2d90e92.272.6 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:315d0f697f37a0603babeb1b688c283b6ac0bf7d184082115fc6e6af92972e34
+size 5725

runs/Feb01_13-44-46_a4f1e2d90e92/events.out.tfevents.1738417499.a4f1e2d90e92.272.7 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:80cd620604bed4ffe77db23df9430dc7a5e9cd02fccfc1338dd9ee494c37bd95
+size 9408

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:13789db8eeb74358645966e07c8b906286149896a893d3eb67472ade542abdc5
 size 5304

 version https://git-lfs.github.com/spec/v1
+oid sha256:8f57697774a3dec1c12cb3b3f60dc28af49a1d010e9b4799c210c018b1fa5616
 size 5304