knowledgator
/

gliner-llama-1.3B-v1.0

Token Classification

information extraction

entity recognition

Model card Files Files and versions Community

Ihor commited on Sep 6

Commit

0e493f5

•

1 Parent(s): c7f5720

Upload folder using huggingface_hub

Files changed (3) hide show

gliner_config.json +9 -7
pytorch_model.bin +1 -1
rng_state.pth +3 -0

gliner_config.json CHANGED Viewed

@@ -43,6 +43,7 @@
     "max_length": 20,
     "max_position_embeddings": 4096,
     "min_length": 0,
     "model_type": "llama",
     "no_repeat_ngram_size": 0,
     "num_attention_heads": 16,
@@ -84,17 +85,18 @@
     "vocab_size": 32002
   },
   "ent_token": "<<ENT>>",
-  "eval_every": 3000,
   "fine_tune": true,
   "freeze_token_rep": false,
   "fuse_layers": false,
   "has_rnn": true,
   "hidden_size": 2048,
   "label_smoothing": 0.0001,
   "labels_encoder": null,
   "labels_encoder_config": null,
-  "log_dir": "llama",
-  "loss_alpha": 0.8,
   "loss_gamma": 2,
   "loss_reduction": "sum",
   "lr_encoder": "8e-6",
@@ -108,13 +110,13 @@
   "model_type": "gliner",
   "name": "span level gliner",
   "num_post_fusion_layers": 3,
-  "num_steps": 9000,
   "post_fusion_schema": "",
   "prev_path": null,
   "random_drop": true,
   "root_dir": "gliner_logs",
-  "save_total_limit": 3,
-  "scheduler_type": "linear",
   "sep_token": "<<SEP>>",
   "shuffle_types": true,
   "size_sup": -1,
@@ -122,7 +124,7 @@
   "subtoken_pooling": "first",
   "train_batch_size": 8,
   "train_data": "data.json",
-  "transformers_version": "4.40.2",
   "val_data_dir": "none",
   "vocab_size": 32002,
   "warmup_ratio": 0.1,

     "max_length": 20,
     "max_position_embeddings": 4096,
     "min_length": 0,
+    "mlp_bias": false,
     "model_type": "llama",
     "no_repeat_ngram_size": 0,
     "num_attention_heads": 16,
     "vocab_size": 32002
   },
   "ent_token": "<<ENT>>",
+  "eval_every": 1000,
   "fine_tune": true,
   "freeze_token_rep": false,
   "fuse_layers": false,
+  "has_post_transformer": false,
   "has_rnn": true,
   "hidden_size": 2048,
   "label_smoothing": 0.0001,
   "labels_encoder": null,
   "labels_encoder_config": null,
+  "log_dir": "models/llama",
+  "loss_alpha": 0.75,
   "loss_gamma": 2,
   "loss_reduction": "sum",
   "lr_encoder": "8e-6",
   "model_type": "gliner",
   "name": "span level gliner",
   "num_post_fusion_layers": 3,
+  "num_steps": 6000,
   "post_fusion_schema": "",
   "prev_path": null,
   "random_drop": true,
   "root_dir": "gliner_logs",
+  "save_total_limit": 5,
+  "scheduler_type": "cosine",
   "sep_token": "<<SEP>>",
   "shuffle_types": true,
   "size_sup": -1,
   "subtoken_pooling": "first",
   "train_batch_size": 8,
   "train_data": "data.json",
+  "transformers_version": "4.41.0",
   "val_data_dir": "none",
   "vocab_size": 32002,
   "warmup_ratio": 0.1,

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c32c1d5ef4f090b497296db17ff0d1449923669c2cc28ad38c2812d02d70d646
 size 5824576326

 version https://git-lfs.github.com/spec/v1
+oid sha256:6e7ed28c6280ca0f67b6fd706451fae9ed8ec7feef033b7ffc1d4c598fce714e
 size 5824576326

rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d70c43962143e6cd0e0aefc33c812d52bbd815bec0182e2cb359410c6a180bb1
+size 14244