End of training

Browse files

Files changed (6) hide show

README.md +5 -5
all_results.json +17 -0
eval_results.json +12 -0
predict_results.txt +539 -0
train_results.json +8 -0
trainer_state.json +264 -0

README.md CHANGED Viewed

@@ -20,11 +20,11 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [xlm-roberta-base](https://huggingface.co/xlm-roberta-base) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.7134
-- Accuracy: 0.8843
-- F1: 0.7634
-- Precision: 0.7812
-- Recall: 0.7463
 ## Model description

 This model is a fine-tuned version of [xlm-roberta-base](https://huggingface.co/xlm-roberta-base) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.4359
+- Accuracy: 0.8513
+- F1: 0.7386
+- Precision: 0.6570
+- Recall: 0.8433
 ## Model description

all_results.json ADDED Viewed

	@@ -0,0 +1,17 @@

+{
+    "epoch": 13.0,
+    "eval_accuracy": 0.8513011152416357,
+    "eval_f1": 0.7385620915032679,
+    "eval_loss": 0.43591225147247314,
+    "eval_precision": 0.6569767441860465,
+    "eval_recall": 0.8432835820895522,
+    "eval_runtime": 2.1114,
+    "eval_samples": 268,
+    "eval_samples_per_second": 254.812,
+    "eval_steps_per_second": 4.263,
+    "train_loss": 0.2951739639471221,
+    "train_runtime": 432.0494,
+    "train_samples": 1878,
+    "train_samples_per_second": 434.673,
+    "train_steps_per_second": 13.656
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,12 @@

+{
+    "epoch": 13.0,
+    "eval_accuracy": 0.8513011152416357,
+    "eval_f1": 0.7385620915032679,
+    "eval_loss": 0.43591225147247314,
+    "eval_precision": 0.6569767441860465,
+    "eval_recall": 0.8432835820895522,
+    "eval_runtime": 2.1114,
+    "eval_samples": 268,
+    "eval_samples_per_second": 254.812,
+    "eval_steps_per_second": 4.263
+}

predict_results.txt ADDED Viewed

	@@ -0,0 +1,539 @@

+index	prediction
+0	1
+1	0
+2	0
+3	0
+4	1
+5	0
+6	1
+7	1
+8	0
+9	0
+10	0
+11	0
+12	1
+13	0
+14	0
+15	1
+16	1
+17	0
+18	1
+19	0
+20	0
+21	0
+22	0
+23	1
+24	0
+25	0
+26	1
+27	1
+28	1
+29	0
+30	0
+31	1
+32	1
+33	1
+34	0
+35	0
+36	0
+37	0
+38	0
+39	0
+40	0
+41	0
+42	0
+43	0
+44	0
+45	0
+46	0
+47	0
+48	0
+49	0
+50	1
+51	0
+52	0
+53	0
+54	0
+55	0
+56	0
+57	0
+58	0
+59	0
+60	0
+61	1
+62	0
+63	1
+64	0
+65	0
+66	0
+67	0
+68	0
+69	0
+70	0
+71	1
+72	1
+73	1
+74	0
+75	0
+76	1
+77	0
+78	0
+79	0
+80	0
+81	0
+82	0
+83	1
+84	1
+85	0
+86	1
+87	0
+88	1
+89	0
+90	0
+91	0
+92	1
+93	0
+94	1
+95	0
+96	1
+97	0
+98	0
+99	1
+100	0
+101	0
+102	0
+103	0
+104	0
+105	1
+106	0
+107	0
+108	1
+109	0
+110	0
+111	1
+112	0
+113	0
+114	1
+115	0
+116	0
+117	0
+118	0
+119	1
+120	0
+121	0
+122	0
+123	0
+124	1
+125	0
+126	0
+127	0
+128	0
+129	0
+130	1
+131	0
+132	0
+133	0
+134	0
+135	0
+136	1
+137	0
+138	0
+139	0
+140	1
+141	0
+142	1
+143	0
+144	1
+145	0
+146	0
+147	1
+148	1
+149	0
+150	1
+151	0
+152	0
+153	0
+154	0
+155	0
+156	0
+157	0
+158	1
+159	0
+160	0
+161	0
+162	0
+163	1
+164	0
+165	1
+166	0
+167	1
+168	0
+169	0
+170	0
+171	1
+172	0
+173	0
+174	1
+175	0
+176	0
+177	1
+178	0
+179	1
+180	1
+181	0
+182	1
+183	0
+184	0
+185	1
+186	1
+187	1
+188	0
+189	0
+190	0
+191	0
+192	1
+193	0
+194	0
+195	0
+196	0
+197	0
+198	1
+199	0
+200	0
+201	0
+202	1
+203	1
+204	0
+205	1
+206	1
+207	0
+208	0
+209	0
+210	0
+211	0
+212	1
+213	0
+214	0
+215	0
+216	1
+217	0
+218	1
+219	0
+220	0
+221	0
+222	0
+223	1
+224	0
+225	0
+226	1
+227	0
+228	1
+229	0
+230	0
+231	1
+232	1
+233	0
+234	1
+235	0
+236	0
+237	1
+238	0
+239	0
+240	1
+241	0
+242	0
+243	0
+244	0
+245	0
+246	0
+247	0
+248	0
+249	1
+250	0
+251	0
+252	0
+253	0
+254	1
+255	0
+256	0
+257	1
+258	0
+259	1
+260	1
+261	0
+262	0
+263	0
+264	0
+265	1
+266	1
+267	0
+268	0
+269	0
+270	0
+271	1
+272	1
+273	0
+274	0
+275	0
+276	0
+277	0
+278	1
+279	1
+280	0
+281	1
+282	0
+283	0
+284	0
+285	0
+286	0
+287	0
+288	0
+289	0
+290	0
+291	0
+292	1
+293	0
+294	1
+295	0
+296	0
+297	1
+298	1
+299	1
+300	0
+301	1
+302	0
+303	1
+304	1
+305	0
+306	1
+307	0
+308	0
+309	0
+310	0
+311	0
+312	0
+313	1
+314	0
+315	0
+316	0
+317	0
+318	1
+319	0
+320	0
+321	1
+322	0
+323	0
+324	1
+325	1
+326	1
+327	0
+328	0
+329	0
+330	0
+331	1
+332	0
+333	0
+334	0
+335	0
+336	0
+337	0
+338	1
+339	0
+340	1
+341	1
+342	0
+343	0
+344	0
+345	0
+346	1
+347	0
+348	1
+349	0
+350	0
+351	0
+352	0
+353	1
+354	0
+355	0
+356	0
+357	0
+358	1
+359	1
+360	1
+361	0
+362	1
+363	1
+364	0
+365	0
+366	1
+367	0
+368	1
+369	0
+370	0
+371	1
+372	0
+373	1
+374	0
+375	0
+376	0
+377	0
+378	1
+379	0
+380	1
+381	0
+382	1
+383	0
+384	1
+385	0
+386	0
+387	1
+388	1
+389	0
+390	1
+391	0
+392	1
+393	0
+394	1
+395	0
+396	0
+397	0
+398	0
+399	0
+400	1
+401	0
+402	0
+403	1
+404	0
+405	1
+406	1
+407	0
+408	0
+409	0
+410	0
+411	1
+412	0
+413	0
+414	0
+415	0
+416	0
+417	1
+418	0
+419	1
+420	1
+421	0
+422	1
+423	1
+424	1
+425	0
+426	1
+427	0
+428	0
+429	0
+430	0
+431	0
+432	0
+433	1
+434	1
+435	0
+436	1
+437	0
+438	0
+439	0
+440	0
+441	1
+442	0
+443	0
+444	0
+445	0
+446	0
+447	0
+448	1
+449	0
+450	0
+451	1
+452	0
+453	0
+454	0
+455	0
+456	1
+457	0
+458	0
+459	0
+460	0
+461	0
+462	0
+463	1
+464	1
+465	0
+466	1
+467	1
+468	0
+469	0
+470	0
+471	1
+472	0
+473	0
+474	0
+475	1
+476	0
+477	0
+478	0
+479	0
+480	1
+481	1
+482	0
+483	0
+484	0
+485	0
+486	1
+487	1
+488	1
+489	0
+490	0
+491	0
+492	0
+493	1
+494	1
+495	1
+496	1
+497	0
+498	0
+499	0
+500	0
+501	0
+502	0
+503	0
+504	0
+505	0
+506	0
+507	0
+508	0
+509	0
+510	0
+511	0
+512	0
+513	0
+514	0
+515	0
+516	1
+517	1
+518	0
+519	0
+520	0
+521	1
+522	1
+523	0
+524	0
+525	0
+526	0
+527	1
+528	0
+529	1
+530	1
+531	0
+532	1
+533	1
+534	0
+535	1
+536	1
+537	1

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 13.0,
+    "train_loss": 0.2951739639471221,
+    "train_runtime": 432.0494,
+    "train_samples": 1878,
+    "train_samples_per_second": 434.673,
+    "train_steps_per_second": 13.656
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,264 @@

+{
+  "best_metric": 0.7894736842105264,
+  "best_model_checkpoint": "outputs/xlm-roberta-base-twitter-indonesia-sarcastic/checkpoint-590",
+  "epoch": 13.0,
+  "eval_steps": 500,
+  "global_step": 767,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "learning_rate": 9.997697221833061e-06,
+      "loss": 0.5641,
+      "step": 59
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.75,
+      "eval_f1": 0.0,
+      "eval_loss": 0.5259643793106079,
+      "eval_precision": 0.0,
+      "eval_recall": 0.0,
+      "eval_runtime": 1.0571,
+      "eval_samples_per_second": 253.522,
+      "eval_steps_per_second": 4.73,
+      "step": 59
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 9.990465155165683e-06,
+      "loss": 0.5317,
+      "step": 118
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.75,
+      "eval_f1": 0.0,
+      "eval_loss": 0.5029988288879395,
+      "eval_precision": 0.0,
+      "eval_recall": 0.0,
+      "eval_runtime": 1.053,
+      "eval_samples_per_second": 254.519,
+      "eval_steps_per_second": 4.748,
+      "step": 118
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 9.978555124138569e-06,
+      "loss": 0.4995,
+      "step": 177
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.75,
+      "eval_f1": 0.0,
+      "eval_loss": 0.4655507504940033,
+      "eval_precision": 0.0,
+      "eval_recall": 0.0,
+      "eval_runtime": 1.0523,
+      "eval_samples_per_second": 254.669,
+      "eval_steps_per_second": 4.751,
+      "step": 177
+    },
+    {
+      "epoch": 4.0,
+      "learning_rate": 9.961568226140335e-06,
+      "loss": 0.4599,
+      "step": 236
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.7686567164179104,
+      "eval_f1": 0.6025641025641025,
+      "eval_loss": 0.4502911865711212,
+      "eval_precision": 0.5280898876404494,
+      "eval_recall": 0.7014925373134329,
+      "eval_runtime": 1.057,
+      "eval_samples_per_second": 253.552,
+      "eval_steps_per_second": 4.73,
+      "step": 236
+    },
+    {
+      "epoch": 5.0,
+      "learning_rate": 9.93968485932029e-06,
+      "loss": 0.4082,
+      "step": 295
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.8470149253731343,
+      "eval_f1": 0.6434782608695653,
+      "eval_loss": 0.378521591424942,
+      "eval_precision": 0.7708333333333334,
+      "eval_recall": 0.5522388059701493,
+      "eval_runtime": 1.0544,
+      "eval_samples_per_second": 254.183,
+      "eval_steps_per_second": 4.742,
+      "step": 295
+    },
+    {
+      "epoch": 6.0,
+      "learning_rate": 9.912926619919478e-06,
+      "loss": 0.3274,
+      "step": 354
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.8619402985074627,
+      "eval_f1": 0.6991869918699187,
+      "eval_loss": 0.3604646623134613,
+      "eval_precision": 0.7678571428571429,
+      "eval_recall": 0.6417910447761194,
+      "eval_runtime": 1.0555,
+      "eval_samples_per_second": 253.908,
+      "eval_steps_per_second": 4.737,
+      "step": 354
+    },
+    {
+      "epoch": 7.0,
+      "learning_rate": 9.881895849126432e-06,
+      "loss": 0.2621,
+      "step": 413
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 0.8619402985074627,
+      "eval_f1": 0.6837606837606838,
+      "eval_loss": 0.3764938712120056,
+      "eval_precision": 0.8,
+      "eval_recall": 0.5970149253731343,
+      "eval_runtime": 1.0562,
+      "eval_samples_per_second": 253.732,
+      "eval_steps_per_second": 4.734,
+      "step": 413
+    },
+    {
+      "epoch": 8.0,
+      "learning_rate": 9.845553233485602e-06,
+      "loss": 0.2332,
+      "step": 472
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.8768656716417911,
+      "eval_f1": 0.759124087591241,
+      "eval_loss": 0.34082189202308655,
+      "eval_precision": 0.7428571428571429,
+      "eval_recall": 0.7761194029850746,
+      "eval_runtime": 1.0525,
+      "eval_samples_per_second": 254.642,
+      "eval_steps_per_second": 4.751,
+      "step": 472
+    },
+    {
+      "epoch": 9.0,
+      "learning_rate": 9.804428641814051e-06,
+      "loss": 0.1579,
+      "step": 531
+    },
+    {
+      "epoch": 9.0,
+      "eval_accuracy": 0.8731343283582089,
+      "eval_f1": 0.7213114754098361,
+      "eval_loss": 0.43820273876190186,
+      "eval_precision": 0.8,
+      "eval_recall": 0.6567164179104478,
+      "eval_runtime": 1.055,
+      "eval_samples_per_second": 254.04,
+      "eval_steps_per_second": 4.74,
+      "step": 531
+    },
+    {
+      "epoch": 10.0,
+      "learning_rate": 9.75856265911873e-06,
+      "loss": 0.1467,
+      "step": 590
+    },
+    {
+      "epoch": 10.0,
+      "eval_accuracy": 0.8805970149253731,
+      "eval_f1": 0.7894736842105264,
+      "eval_loss": 0.38548171520233154,
+      "eval_precision": 0.7058823529411765,
+      "eval_recall": 0.8955223880597015,
+      "eval_runtime": 1.053,
+      "eval_samples_per_second": 254.501,
+      "eval_steps_per_second": 4.748,
+      "step": 590
+    },
+    {
+      "epoch": 11.0,
+      "learning_rate": 9.708000549587091e-06,
+      "loss": 0.098,
+      "step": 649
+    },
+    {
+      "epoch": 11.0,
+      "eval_accuracy": 0.8805970149253731,
+      "eval_f1": 0.7500000000000001,
+      "eval_loss": 0.46932676434516907,
+      "eval_precision": 0.7868852459016393,
+      "eval_recall": 0.7164179104477612,
+      "eval_runtime": 1.058,
+      "eval_samples_per_second": 253.305,
+      "eval_steps_per_second": 4.726,
+      "step": 649
+    },
+    {
+      "epoch": 12.0,
+      "learning_rate": 9.653766360237254e-06,
+      "loss": 0.0929,
+      "step": 708
+    },
+    {
+      "epoch": 12.0,
+      "eval_accuracy": 0.8805970149253731,
+      "eval_f1": 0.7333333333333334,
+      "eval_loss": 0.6206381916999817,
+      "eval_precision": 0.8301886792452831,
+      "eval_recall": 0.6567164179104478,
+      "eval_runtime": 1.0526,
+      "eval_samples_per_second": 254.603,
+      "eval_steps_per_second": 4.75,
+      "step": 708
+    },
+    {
+      "epoch": 13.0,
+      "learning_rate": 9.594043625628571e-06,
+      "loss": 0.0555,
+      "step": 767
+    },
+    {
+      "epoch": 13.0,
+      "eval_accuracy": 0.8843283582089553,
+      "eval_f1": 0.7633587786259542,
+      "eval_loss": 0.7134280800819397,
+      "eval_precision": 0.78125,
+      "eval_recall": 0.746268656716418,
+      "eval_runtime": 1.054,
+      "eval_samples_per_second": 254.279,
+      "eval_steps_per_second": 4.744,
+      "step": 767
+    },
+    {
+      "epoch": 13.0,
+      "step": 767,
+      "total_flos": 1605898326389760.0,
+      "train_loss": 0.2951739639471221,
+      "train_runtime": 432.0494,
+      "train_samples_per_second": 434.673,
+      "train_steps_per_second": 13.656
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 5900,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 100,
+  "save_steps": 500,
+  "total_flos": 1605898326389760.0,
+  "train_batch_size": 32,
+  "trial_name": null,
+  "trial_params": null
+}