Cheng98
/

opt-125m-qnli

Text Classification

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Cheng98 commited on Apr 7

Commit

ce12b09

•

1 Parent(s): faadca3

Delete trainer_state.json

Files changed (1) hide show

trainer_state.json +0 -97

trainer_state.json DELETED Viewed

@@ -1,97 +0,0 @@
-{
-  "best_metric": null,
-  "best_model_checkpoint": null,
-  "epoch": 3.9981670994348555,
-  "global_step": 3272,
-  "is_hyper_param_search": false,
-  "is_local_process_zero": true,
-  "is_world_process_zero": true,
-  "log_history": [
-    {
-      "epoch": 0.61,
-      "learning_rate": 4.235941320293399e-05,
-      "loss": 0.7001,
-      "step": 500
-    },
-    {
-      "epoch": 1.0,
-      "eval_accuracy": 0.4946000366099213,
-      "eval_loss": 0.6950803995132446,
-      "eval_runtime": 11.8643,
-      "eval_samples_per_second": 460.458,
-      "eval_steps_per_second": 14.413,
-      "step": 818
-    },
-    {
-      "epoch": 1.22,
-      "learning_rate": 3.4718826405867974e-05,
-      "loss": 0.6944,
-      "step": 1000
-    },
-    {
-      "epoch": 1.83,
-      "learning_rate": 2.7078239608801957e-05,
-      "loss": 0.6939,
-      "step": 1500
-    },
-    {
-      "epoch": 2.0,
-      "eval_accuracy": 0.500823723228995,
-      "eval_loss": 0.6931571960449219,
-      "eval_runtime": 11.8884,
-      "eval_samples_per_second": 459.523,
-      "eval_steps_per_second": 14.384,
-      "step": 1636
-    },
-    {
-      "epoch": 2.44,
-      "learning_rate": 1.9437652811735943e-05,
-      "loss": 0.6936,
-      "step": 2000
-    },
-    {
-      "epoch": 3.0,
-      "eval_accuracy": 0.5053999633900788,
-      "eval_loss": 0.6934992671012878,
-      "eval_runtime": 11.87,
-      "eval_samples_per_second": 460.234,
-      "eval_steps_per_second": 14.406,
-      "step": 2455
-    },
-    {
-      "epoch": 3.05,
-      "learning_rate": 1.1797066014669928e-05,
-      "loss": 0.6936,
-      "step": 2500
-    },
-    {
-      "epoch": 3.67,
-      "learning_rate": 4.156479217603912e-06,
-      "loss": 0.6934,
-      "step": 3000
-    },
-    {
-      "epoch": 4.0,
-      "eval_accuracy": 0.5032033681127586,
-      "eval_loss": 0.6931605935096741,
-      "eval_runtime": 11.8623,
-      "eval_samples_per_second": 460.535,
-      "eval_steps_per_second": 14.415,
-      "step": 3272
-    },
-    {
-      "epoch": 4.0,
-      "step": 3272,
-      "total_flos": 1.0942820488367309e+17,
-      "train_loss": 0.6947066952954878,
-      "train_runtime": 2952.2911,
-      "train_samples_per_second": 141.914,
-      "train_steps_per_second": 1.108
-    }
-  ],
-  "max_steps": 3272,
-  "num_train_epochs": 4,
-  "total_flos": 1.0942820488367309e+17,
-  "trial_name": null,
-  "trial_params": null
-}