Model save

Files changed (8) hide show

adapter_config.json CHANGED Viewed

@@ -19,13 +19,13 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
-    "k_proj",
     "q_proj",
     "down_proj",
-    "o_proj",
-    "gate_proj",
     "v_proj",
-    "up_proj"
   ],
   "task_type": "CAUSAL_LM"
 }

   "rank_pattern": {},
   "revision": null,
   "target_modules": [
     "q_proj",
     "down_proj",
+    "k_proj",
+    "up_proj",
     "v_proj",
+    "gate_proj",
+    "o_proj"
   ],
   "task_type": "CAUSAL_LM"
 }

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
     "epoch": 1.0,
     "eval_loss": 0.9502018094062805,
-    "eval_runtime": 365.2439,
     "eval_samples": 23110,
-    "eval_samples_per_second": 42.248,
     "eval_steps_per_second": 0.663,
     "train_loss": 0.03432130868306889,
-    "train_runtime": 783.0861,
     "train_samples": 207865,
-    "train_samples_per_second": 178.047,
-    "train_steps_per_second": 2.783
 }

 {
     "epoch": 1.0,
     "eval_loss": 0.9502018094062805,
+    "eval_runtime": 365.0584,
     "eval_samples": 23110,
+    "eval_samples_per_second": 42.27,
     "eval_steps_per_second": 0.663,
     "train_loss": 0.03432130868306889,
+    "train_runtime": 783.2781,
     "train_samples": 207865,
+    "train_samples_per_second": 178.003,
+    "train_steps_per_second": 2.782
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 1.0,
     "eval_loss": 0.9502018094062805,
-    "eval_runtime": 365.2439,
     "eval_samples": 23110,
-    "eval_samples_per_second": 42.248,
     "eval_steps_per_second": 0.663
 }

 {
     "epoch": 1.0,
     "eval_loss": 0.9502018094062805,
+    "eval_runtime": 365.0584,
     "eval_samples": 23110,
+    "eval_samples_per_second": 42.27,
     "eval_steps_per_second": 0.663
 }

runs/Jan04_11-16-18_ip-26-0-165-24/events.out.tfevents.1704367061.ip-26-0-165-24.2274601.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:6548b8b051262639033d0bac43788b87b661780ca8a893e318b2d77b2a3873d6
+size 7801

runs/Jan04_11-16-18_ip-26-0-165-24/events.out.tfevents.1704368210.ip-26-0-165-24.2274601.1 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:60d066719fd0ac15bd9d35b0d1650f8fe2ad270ee1745aa04f0ec354e3e881a7
+size 359

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 1.0,
     "train_loss": 0.03432130868306889,
-    "train_runtime": 783.0861,
     "train_samples": 207865,
-    "train_samples_per_second": 178.047,
-    "train_steps_per_second": 2.783
 }

 {
     "epoch": 1.0,
     "train_loss": 0.03432130868306889,
+    "train_runtime": 783.2781,
     "train_samples": 207865,
+    "train_samples_per_second": 178.003,
+    "train_steps_per_second": 2.782
 }

trainer_state.json CHANGED Viewed

@@ -2627,9 +2627,9 @@
     {
       "epoch": 1.0,
       "eval_loss": 0.9502018094062805,
-      "eval_runtime": 365.5893,
-      "eval_samples_per_second": 42.209,
-      "eval_steps_per_second": 0.662,
       "step": 2179
     },
     {
@@ -2637,9 +2637,9 @@
       "step": 2179,
       "total_flos": 1.225695388701714e+19,
       "train_loss": 0.03432130868306889,
-      "train_runtime": 783.0861,
-      "train_samples_per_second": 178.047,
-      "train_steps_per_second": 2.783
     }
   ],
   "logging_steps": 5,

     {
       "epoch": 1.0,
       "eval_loss": 0.9502018094062805,
+      "eval_runtime": 365.9285,
+      "eval_samples_per_second": 42.169,
+      "eval_steps_per_second": 0.661,
       "step": 2179
     },
     {
       "step": 2179,
       "total_flos": 1.225695388701714e+19,
       "train_loss": 0.03432130868306889,
+      "train_runtime": 783.2781,
+      "train_samples_per_second": 178.003,
+      "train_steps_per_second": 2.782
     }
   ],
   "logging_steps": 5,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8296efc6b3d38092e1e15f62d34f32c6b6ebdfe40f00e6b26c05539ebef4b8b6
 size 4728

 version https://git-lfs.github.com/spec/v1
+oid sha256:4e4d8f4a9fbb85e52781910d73f1ebd7b696695be6d362a5441200e65205e397
 size 4728