MSey
/

CaGBERT-base_fl32_checkpoint-15852

@@ -11,166 +11,38 @@ pipeline_tag: token-classification
 We fine-tuned our base model for 71 epochs on the Ca dataset, epoch 61 showed the best results.
 ## Metrics
 seqeval entity-wise in evaulate
-_train_AVGf1 0.9756326545937595
-_train_DIAGNOSIS.avg_tokens_per_entity 6.812357501139991
-_train_DIAGNOSIS.entity_count 8772
-_train_DIAGNOSIS.f1 0.9847202499289974
-_train_DIAGNOSIS.precision 0.9813200498132005
-_train_DIAGNOSIS.recall 0.9881440948472412
-_train_DIAGNOSIS.token_count 59758
-_train_DIAGNOSTIC.avg_tokens_per_entity 5.99338106173173
-_train_DIAGNOSTIC.entity_count 7403
-_train_DIAGNOSTIC.f1 0.9729585006693441
-_train_DIAGNOSTIC.precision 0.9643094069258326
-_train_DIAGNOSTIC.recall 0.9817641496690531
-_train_DIAGNOSTIC.token_count 44369
-_train_DRUG.avg_tokens_per_entity 3.8747056052755533
-_train_DRUG.entity_count 4246
-_train_DRUG.f1 0.9928328046058043
-_train_DRUG.precision 0.9906213364595545
-_train_DRUG.recall 0.9950541686292982
-_train_DRUG.token_count 16452
-_train_MEDICAL_FINDING.avg_tokens_per_entity 8.822587975587586
-_train_MEDICAL_FINDING.entity_count 30804
-_train_MEDICAL_FINDING.f1 0.9658010684140024
-_train_MEDICAL_FINDING.precision 0.9603299419071156
-_train_MEDICAL_FINDING.recall 0.9713348915725231
-_train_MEDICAL_FINDING.token_count 271771
-_train_THERAPY.avg_tokens_per_entity 8.560322448421916
-_train_THERAPY.entity_count 7319
-_train_THERAPY.f1 0.9618506493506493
-_train_THERAPY.precision 0.9524447421299397
-_train_THERAPY.recall 0.9714441863642574
-_train_THERAPY.token_count 62653
-_train_accuracy 0.9938551197147224
-_train_f1 0.9709934550640488
-_train_loss 0.020609384402632713
-_train_precision 0.9651517964122382
-_train_recall 0.9769062585405849
-_train_runtime 142.8691
-_train_samples_per_second 229.063
-_train_steps_per_second 28.635
 eval_AVGf1 0.7889642398534424
-eval_DIAGNOSIS.avg_len 6.790370685982105
-eval_DIAGNOSIS.avg_tokens_per_entity 6.790370685982105
-eval_DIAGNOSIS.count 2347
-eval_DIAGNOSIS.entity_count 2347
 eval_DIAGNOSIS.f1 0.7870941224825319
 eval_DIAGNOSIS.precision 0.760222310440651
 eval_DIAGNOSIS.recall 0.815935236472092
-eval_DIAGNOSIS.token_count 15937
-eval_DIAGNOSTIC.avg_len 6.030130756111427
-eval_DIAGNOSTIC.avg_tokens_per_entity 6.030130756111427
-eval_DIAGNOSTIC.count 1759
-eval_DIAGNOSTIC.entity_count 1759
 eval_DIAGNOSTIC.f1 0.7870518994114499
 eval_DIAGNOSTIC.precision 0.7433046993431026
 eval_DIAGNOSTIC.recall 0.8362706083001705
-eval_DIAGNOSTIC.token_count 10607
-eval_DRUG.avg_len 3.9235500878734624
-eval_DRUG.avg_tokens_per_entity 3.9235500878734624
-eval_DRUG.count 1138
-eval_DRUG.entity_count 1138
 eval_DRUG.f1 0.9196581196581196
 eval_DRUG.precision 0.8951747088186356
 eval_DRUG.recall 0.945518453427065
-eval_DRUG.token_count 4465
-eval_MEDICAL_FINDING.avg_len 8.781120867768594
-eval_MEDICAL_FINDING.avg_tokens_per_entity 8.781120867768594
-eval_MEDICAL_FINDING.count 7744
-eval_MEDICAL_FINDING.entity_count 7744
 eval_MEDICAL_FINDING.f1 0.7699975080986794
 eval_MEDICAL_FINDING.precision 0.7438613384689456
 eval_MEDICAL_FINDING.recall 0.7980371900826446
-eval_MEDICAL_FINDING.token_count 68001
-eval_THERAPY.avg_len 8.44420941300899
-eval_THERAPY.avg_tokens_per_entity 8.44420941300899
-eval_THERAPY.count 1891
-eval_THERAPY.entity_count 1891
 eval_THERAPY.f1 0.6810195496164316
 eval_THERAPY.precision 0.64
 eval_THERAPY.recall 0.7276573241671074
-eval_THERAPY.token_count 15968
 eval_accuracy 0.9332097564796261
 eval_f1 0.7744305184135064
@@ -181,94 +53,44 @@ eval_precision 0.7437801708132195
 eval_recall 0.8077155722830835
-eval_runtime 36.8437
-eval_samples_per_second 222.073
-eval_steps_per_second 27.766
 test_AVGf1 0.7491200818619402
-test_DIAGNOSIS.avg_len 7.408243727598566
-test_DIAGNOSIS.avg_tokens_per_entity 7.408243727598566
-test_DIAGNOSIS.count 2790
-test_DIAGNOSIS.entity_count 2790
 test_DIAGNOSIS.f1 0.703534151254349
 test_DIAGNOSIS.precision 0.7192062897791089
 test_DIAGNOSIS.recall 0.6885304659498208
-test_DIAGNOSIS.token_count 20669
-test_DIAGNOSTIC.avg_len 6.136954503249767
-test_DIAGNOSTIC.avg_tokens_per_entity 6.136954503249767
-test_DIAGNOSTIC.count 2154
-test_DIAGNOSTIC.entity_count 2154
 test_DIAGNOSTIC.f1 0.7718579234972678
 test_DIAGNOSTIC.precision 0.7573726541554959
 test_DIAGNOSTIC.recall 0.786908077994429
-test_DIAGNOSTIC.token_count 13219
-test_DRUG.avg_len 3.7937931034482757
-test_DRUG.avg_tokens_per_entity 3.7937931034482757
-test_DRUG.count 1450
-test_DRUG.entity_count 1450
 test_DRUG.f1 0.9024472008045592
 test_DRUG.precision 0.878016960208741
 test_DRUG.recall 0.9282758620689655
-test_DRUG.token_count 5501
-test_MEDICAL_FINDING.avg_len 9.53191489361702
-test_MEDICAL_FINDING.avg_tokens_per_entity 9.53191489361702
-test_MEDICAL_FINDING.count 8366
-test_MEDICAL_FINDING.entity_count 8366
 test_MEDICAL_FINDING.f1 0.7280362842264404
 test_MEDICAL_FINDING.precision 0.6848203939745076
 test_MEDICAL_FINDING.recall 0.7770738704279225
-test_MEDICAL_FINDING.token_count 79744
-test_THERAPY.avg_len 8.884771802982376
-test_THERAPY.avg_tokens_per_entity 8.884771802982376
-test_THERAPY.count 2213
-test_THERAPY.entity_count 2213
 test_THERAPY.f1 0.639724849527085
 test_THERAPY.precision 0.6100861008610086
 test_THERAPY.recall 0.6723904202440126
-test_THERAPY.token_count 19662
 test_accuracy 0.9229989726085077
 test_f1 0.7327920332701502
@@ -279,8 +101,8 @@ test_precision 0.7048546859693045
 test_recall 0.7630354091792847
-test_runtime 42.7477
-test_samples_per_second 221.977
-test_steps_per_second 27.768

 We fine-tuned our base model for 71 epochs on the Ca dataset, epoch 61 showed the best results.
 ## Metrics
 seqeval entity-wise in evaulate
 eval_AVGf1 0.7889642398534424
 eval_DIAGNOSIS.f1 0.7870941224825319
 eval_DIAGNOSIS.precision 0.760222310440651
 eval_DIAGNOSIS.recall 0.815935236472092
 eval_DIAGNOSTIC.f1 0.7870518994114499
 eval_DIAGNOSTIC.precision 0.7433046993431026
 eval_DIAGNOSTIC.recall 0.8362706083001705
 eval_DRUG.f1 0.9196581196581196
 eval_DRUG.precision 0.8951747088186356
 eval_DRUG.recall 0.945518453427065
 eval_MEDICAL_FINDING.f1 0.7699975080986794
 eval_MEDICAL_FINDING.precision 0.7438613384689456
 eval_MEDICAL_FINDING.recall 0.7980371900826446
 eval_THERAPY.f1 0.6810195496164316
 eval_THERAPY.precision 0.64
 eval_THERAPY.recall 0.7276573241671074
 eval_accuracy 0.9332097564796261
 eval_f1 0.7744305184135064
 eval_recall 0.8077155722830835
+eval_runtime 50.3125
+eval_samples_per_second 162.624
+eval_steps_per_second 20.333
 test_AVGf1 0.7491200818619402
 test_DIAGNOSIS.f1 0.703534151254349
 test_DIAGNOSIS.precision 0.7192062897791089
 test_DIAGNOSIS.recall 0.6885304659498208
 test_DIAGNOSTIC.f1 0.7718579234972678
 test_DIAGNOSTIC.precision 0.7573726541554959
 test_DIAGNOSTIC.recall 0.786908077994429
 test_DRUG.f1 0.9024472008045592
 test_DRUG.precision 0.878016960208741
 test_DRUG.recall 0.9282758620689655
 test_MEDICAL_FINDING.f1 0.7280362842264404
 test_MEDICAL_FINDING.precision 0.6848203939745076
 test_MEDICAL_FINDING.recall 0.7770738704279225
 test_THERAPY.f1 0.639724849527085
 test_THERAPY.precision 0.6100861008610086
 test_THERAPY.recall 0.6723904202440126
 test_accuracy 0.9229989726085077
 test_f1 0.7327920332701502
 test_recall 0.7630354091792847
+test_runtime 58.5022
+test_samples_per_second 162.199
+test_steps_per_second 20.29