Update spacy pipeline to 3.6.0

Browse files

Files changed (15) hide show

README.md +24 -24
config.cfg +6 -4
hu_core_news_md-any-py3-none-any.whl +2 -2
meta.json +192 -192
morphologizer/cfg +1 -0
morphologizer/model +1 -1
ner/model +1 -1
parser/model +1 -1
senter/model +1 -1
tagger/cfg +1 -0
tagger/model +1 -1
tok2vec/model +1 -1
trainable_lemmatizer/model +1 -1
vocab/strings.json +2 -2
vocab/vectors.cfg +2 -1

README.md CHANGED Viewed

@@ -14,55 +14,55 @@ model-index:
     metrics:
     - name: NER Precision
       type: precision
-      value: 0.8557640751
     - name: NER Recall
       type: recall
-      value: 0.8417721519
     - name: NER F Score
       type: f_score
-      value: 0.8487104493
   - task:
       name: TAG
       type: token-classification
     metrics:
     - name: TAG (XPOS) Accuracy
       type: accuracy
-      value: 0.9633953778
   - task:
       name: POS
       type: token-classification
     metrics:
     - name: POS (UPOS) Accuracy
       type: accuracy
-      value: 0.964398507
   - task:
       name: MORPH
       type: token-classification
     metrics:
     - name: Morph (UFeats) Accuracy
       type: accuracy
-      value: 0.9338692698
   - task:
       name: LEMMA
       type: token-classification
     metrics:
     - name: Lemma Accuracy
       type: accuracy
-      value: 0.9724428284
   - task:
       name: UNLABELED_DEPENDENCIES
       type: token-classification
     metrics:
     - name: Unlabeled Attachment Score (UAS)
       type: f_score
-      value: 0.7978436658
   - task:
       name: LABELED_DEPENDENCIES
       type: token-classification
     metrics:
     - name: Labeled Attachment Score (LAS)
       type: f_score
-      value: 0.7223314055
   - task:
       name: SENTS
       type: token-classification
@@ -76,12 +76,12 @@ Core Hungarian model for HuSpaCy. Components: tok2vec, senter, tagger, morpholog
 | Feature | Description |
 | --- | --- |
 | **Name** | `hu_core_news_md` |
-| **Version** | `3.5.2` |
-| **spaCy** | `>=3.5.0,<3.6.0` |
 | **Default Pipeline** | `tok2vec`, `senter`, `tagger`, `morphologizer`, `lookup_lemmatizer`, `trainable_lemmatizer`, `parser`, `ner` |
 | **Components** | `tok2vec`, `senter`, `tagger`, `morphologizer`, `lookup_lemmatizer`, `trainable_lemmatizer`, `parser`, `ner` |
 | **Vectors** | -1 keys, 200000 unique vectors (100 dimensions) |
-| **Sources** | [UD Hungarian Szeged](https://universaldependencies.org/treebanks/hu_szeged/index.html) (Richárd Farkas, Katalin Simkó, Zsolt Szántó, Viktor Varga, Veronika Vincze (MTA-SZTE Research Group on Artificial Intelligence))<br />[NYTK-NerKor Corpus](https://github.com/nytud/NYTK-NerKor) (Eszter Simon, Noémi Vadász (Department of Language Technology and Applied Linguistics))<br />[hunNERwiki](http://hlt.sztaki.hu/resources/hunnerwiki.html) (Eszter Simon, Dávid Márk Nemeskey (HLT Group, Budapest University of Technology and Economics))<br />[Szeged NER Corpus](https://rgai.inf.u-szeged.hu/node/130) (György Szarvas, Richárd Farkas, László Felföldi, András Kocsor, János Csirik (MTA-SZTE Research Group on Artificial Intelligence)) |
 | **License** | `cc-by-sa-4.0` |
 | **Author** | [SzegedAI, MILAB](https://github.com/huspacy/huspacy) |
@@ -111,15 +111,15 @@ Core Hungarian model for HuSpaCy. Components: tok2vec, senter, tagger, morpholog
 | `SENTS_P` | 98.21 |
 | `SENTS_R` | 97.55 |
 | `SENTS_F` | 97.88 |
-| `TAG_ACC` | 96.34 |
-| `POS_ACC` | 96.44 |
-| `MORPH_ACC` | 93.39 |
-| `MORPH_MICRO_P` | 96.76 |
-| `MORPH_MICRO_R` | 95.92 |
-| `MORPH_MICRO_F` | 96.34 |
-| `LEMMA_ACC` | 97.24 |
-| `DEP_UAS` | 79.78 |
-| `DEP_LAS` | 72.23 |
-| `ENTS_P` | 85.58 |
-| `ENTS_R` | 84.18 |
-| `ENTS_F` | 84.87 |

     metrics:
     - name: NER Precision
       type: precision
+      value: 0.8479221927
     - name: NER Recall
       type: recall
+      value: 0.8430028129
     - name: NER F Score
       type: f_score
+      value: 0.8454553469
   - task:
       name: TAG
       type: token-classification
     metrics:
     - name: TAG (XPOS) Accuracy
       type: accuracy
+      value: 0.9640156953
   - task:
       name: POS
       type: token-classification
     metrics:
     - name: POS (UPOS) Accuracy
       type: accuracy
+      value: 0.9655469423
   - task:
       name: MORPH
       type: token-classification
     metrics:
     - name: Morph (UFeats) Accuracy
       type: accuracy
+      value: 0.9339649727
   - task:
       name: LEMMA
       type: token-classification
     metrics:
     - name: Lemma Accuracy
       type: accuracy
+      value: 0.9730169362
   - task:
       name: UNLABELED_DEPENDENCIES
       type: token-classification
     metrics:
     - name: Unlabeled Attachment Score (UAS)
       type: f_score
+      value: 0.8103583867
   - task:
       name: LABELED_DEPENDENCIES
       type: token-classification
     metrics:
     - name: Labeled Attachment Score (LAS)
       type: f_score
+      value: 0.743357861
   - task:
       name: SENTS
       type: token-classification
 | Feature | Description |
 | --- | --- |
 | **Name** | `hu_core_news_md` |
+| **Version** | `3.6.0` |
+| **spaCy** | `>=3.6.0,<3.7.0` |
 | **Default Pipeline** | `tok2vec`, `senter`, `tagger`, `morphologizer`, `lookup_lemmatizer`, `trainable_lemmatizer`, `parser`, `ner` |
 | **Components** | `tok2vec`, `senter`, `tagger`, `morphologizer`, `lookup_lemmatizer`, `trainable_lemmatizer`, `parser`, `ner` |
 | **Vectors** | -1 keys, 200000 unique vectors (100 dimensions) |
+| **Sources** | [UD Hungarian Szeged](https://universaldependencies.org/treebanks/hu_szeged/index.html) (Richárd Farkas, Katalin Simkó, Zsolt Szántó, Viktor Varga, Veronika Vincze (MTA-SZTE Research Group on Artificial Intelligence))<br />[NYTK-NerKor Corpus](https://github.com/nytud/NYTK-NerKor) (Eszter Simon, Noémi Vadász (Department of Language Technology and Applied Linguistics))<br />[Szeged NER Corpus](https://rgai.inf.u-szeged.hu/node/130) (György Szarvas, Richárd Farkas, László Felföldi, András Kocsor, János Csirik (MTA-SZTE Research Group on Artificial Intelligence))<br />[Hungarian lg Floret vectors](https://huggingface.co/huspacy/hu_vectors_web_lg) (Szeged AI) |
 | **License** | `cc-by-sa-4.0` |
 | **Author** | [SzegedAI, MILAB](https://github.com/huspacy/huspacy) |
 | `SENTS_P` | 98.21 |
 | `SENTS_R` | 97.55 |
 | `SENTS_F` | 97.88 |
+| `TAG_ACC` | 96.40 |
+| `POS_ACC` | 96.55 |
+| `MORPH_ACC` | 93.40 |
+| `MORPH_MICRO_P` | 96.93 |
+| `MORPH_MICRO_R` | 96.11 |
+| `MORPH_MICRO_F` | 96.52 |
+| `LEMMA_ACC` | 97.30 |
+| `DEP_UAS` | 81.04 |
+| `DEP_LAS` | 74.34 |
+| `ENTS_P` | 84.79 |
+| `ENTS_R` | 84.30 |
+| `ENTS_F` | 84.55 |

config.cfg CHANGED Viewed

@@ -1,8 +1,8 @@
 [paths]
-parser_model = "models/hu_core_news_md-parser-3.5.2/model-best"
-ner_model = "models/hu_core_news_md-ner-3.5.2/model-best"
-lemmatizer_lookups = "models/hu_core_news_md-lookup-lemmatizer-3.5.2"
-tagger_model = "models/hu_core_news_md-tagger-3.5.2/model-best"
 train = null
 dev = null
 vectors = null
@@ -32,6 +32,7 @@ source = ${paths.lemmatizer_lookups}
 [components.morphologizer]
 factory = "morphologizer"
 extend = false
 overwrite = true
 scorer = {"@scorers":"spacy.morphologizer_scorer.v1"}
@@ -118,6 +119,7 @@ upstream = "*"
 [components.tagger]
 factory = "tagger"
 neg_prefix = "!"
 overwrite = false
 scorer = {"@scorers":"spacy.tagger_scorer.v1"}

 [paths]
+parser_model = "models/hu_core_news_md-parser-3.6.0/model-best"
+ner_model = "models/hu_core_news_md-ner-3.6.0/model-best"
+lemmatizer_lookups = "models/hu_core_news_md-lookup-lemmatizer-3.6.0"
+tagger_model = "models/hu_core_news_md-tagger-3.6.0/model-best"
 train = null
 dev = null
 vectors = null
 [components.morphologizer]
 factory = "morphologizer"
 extend = false
+label_smoothing = 0.0
 overwrite = true
 scorer = {"@scorers":"spacy.morphologizer_scorer.v1"}
 [components.tagger]
 factory = "tagger"
+label_smoothing = 0.0
 neg_prefix = "!"
 overwrite = false
 scorer = {"@scorers":"spacy.tagger_scorer.v1"}

hu_core_news_md-any-py3-none-any.whl CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7077e87b0093f3d1d2ce8786327346307a2f19405a6ecf5327c667853810baf7
-size 126880310

 version https://git-lfs.github.com/spec/v1
+oid sha256:f9d6fccef1fb7c657e44b246f8eadd6cc6336078522b7fb4b3a61af548667728
+size 126873936

meta.json CHANGED Viewed

@@ -1,14 +1,14 @@
 {
   "lang":"hu",
   "name":"core_news_md",
-  "version":"3.5.2",
   "description":"Core Hungarian model for HuSpaCy. Components: tok2vec, senter, tagger, morphologizer, lemmatizer, parser, ner",
   "author":"SzegedAI, MILAB",
   "email":"gyorgy@orosz.link",
   "url":"https://github.com/huspacy/huspacy",
   "license":"cc-by-sa-4.0",
-  "spacy_version":">=3.5.0,<3.6.0",
-  "spacy_git_version":"Unknown",
   "vectors":{
     "width":100,
     "vectors":200000,
@@ -1271,82 +1271,82 @@
     "sents_p":0.9820627803,
     "sents_r":0.9755011136,
     "sents_f":0.9787709497,
-    "tag_acc":0.9633953778,
-    "pos_acc":0.964398507,
-    "morph_acc":0.9338692698,
-    "morph_micro_p":0.9676174788,
-    "morph_micro_r":0.9592178771,
-    "morph_micro_f":0.9633993698,
     "morph_per_feat":{
       "Definite":{
-        "p":0.956837801,
-        "r":0.9827344844,
-        "f":0.9696132597
       },
       "PronType":{
-        "p":0.970814978,
-        "r":0.9729580574,
-        "f":0.9718853363
       },
       "Case":{
-        "p":0.9771084337,
-        "r":0.9614700652,
-        "f":0.9692261727
       },
       "Degree":{
-        "p":0.9371584699,
-        "r":0.8560732113,
-        "f":0.8947826087
       },
       "Number":{
-        "p":0.9876396885,
-        "r":0.977543154,
-        "f":0.9825654847
       },
       "Mood":{
-        "p":0.920824295,
-        "r":0.9412416851,
-        "f":0.9309210526
       },
       "Person":{
-        "p":0.9566666667,
-        "r":0.9440789474,
-        "f":0.9503311258
       },
       "Tense":{
-        "p":0.9609544469,
-        "r":0.9790055249,
-        "f":0.9698960044
       },
       "VerbForm":{
-        "p":0.9490291262,
-        "r":0.9406575782,
-        "f":0.9448248087
       },
       "Voice":{
-        "p":0.9549098196,
-        "r":0.9744376278,
-        "f":0.9645748988
       },
       "Number[psor]":{
-        "p":0.9707174231,
-        "r":0.9444444444,
-        "f":0.957400722
       },
       "Person[psor]":{
-        "p":0.972181552,
-        "r":0.9472182596,
-        "f":0.9595375723
       },
       "NumType":{
-        "p":0.9178743961,
-        "r":0.9268292683,
-        "f":0.9223300971
       },
       "Reflex":{
         "p":1.0,
-        "r":0.625,
-        "f":0.7692307692
       },
       "Aspect":{
         "p":0.0,
@@ -1364,114 +1364,114 @@
         "f":1.0
       }
     },
-    "lemma_acc":0.9724428284,
-    "dep_uas":0.7978436658,
-    "dep_las":0.7223314055,
     "dep_las_per_type":{
       "det":{
-        "p":0.8576952823,
-        "r":0.8829617834,
-        "f":0.870145155
       },
       "amod:att":{
-        "p":0.8220064725,
-        "r":0.830744072,
-        "f":0.8263521757
       },
       "nsubj":{
-        "p":0.7247557003,
-        "r":0.6953125,
-        "f":0.7097288676
       },
       "advmod:mode":{
-        "p":0.4978723404,
-        "r":0.5735294118,
-        "f":0.5330296128
       },
       "nmod:att":{
-        "p":0.7560553633,
-        "r":0.7406779661,
-        "f":0.7482876712
       },
       "obl":{
-        "p":0.754789272,
-        "r":0.7092709271,
-        "f":0.7313225058
       },
       "obj":{
-        "p":0.8498896247,
-        "r":0.8651685393,
-        "f":0.8574610245
       },
       "root":{
-        "p":0.802690583,
-        "r":0.7973273942,
-        "f":0.8
       },
       "cc":{
-        "p":0.6831460674,
-        "r":0.64,
-        "f":0.6608695652
       },
       "conj":{
-        "p":0.4219858156,
-        "r":0.4958333333,
-        "f":0.4559386973
       },
       "advmod":{
-        "p":0.8369565217,
         "r":0.8105263158,
-        "f":0.8235294118
       },
       "flat:name":{
-        "p":0.8617511521,
-        "r":0.8738317757,
-        "f":0.86774942
       },
       "appos":{
-        "p":0.35,
-        "r":0.2234042553,
-        "f":0.2727272727
       },
       "advcl":{
-        "p":0.2739726027,
-        "r":0.2040816327,
-        "f":0.2339181287
       },
       "advmod:tlocy":{
-        "p":0.6293436293,
-        "r":0.7086956522,
-        "f":0.6666666667
       },
       "ccomp:obj":{
-        "p":0.2702702703,
-        "r":0.303030303,
-        "f":0.2857142857
       },
       "mark":{
-        "p":0.8125,
-        "r":0.8227848101,
-        "f":0.8176100629
       },
       "compound:preverb":{
-        "p":0.9107142857,
-        "r":0.9357798165,
-        "f":0.9230769231
       },
       "advmod:locy":{
-        "p":0.9166666667,
-        "r":0.34375,
-        "f":0.5
       },
       "cop":{
-        "p":0.7407407407,
-        "r":0.487804878,
-        "f":0.5882352941
       },
       "nmod:obl":{
-        "p":0.1666666667,
-        "r":0.15,
-        "f":0.1578947368
       },
       "advmod:to":{
         "p":0.0,
@@ -1479,99 +1479,104 @@
         "f":0.0
       },
       "obj:lvc":{
-        "p":0.2,
         "r":0.0833333333,
-        "f":0.1176470588
       },
       "ccomp:obl":{
-        "p":0.3636363636,
-        "r":0.375,
-        "f":0.3692307692
       },
       "iobj":{
-        "p":0.2142857143,
         "r":0.4,
-        "f":0.2790697674
       },
       "dep":{
         "p":0.0,
         "r":0.0,
         "f":0.0
       },
-      "acl":{
-        "p":0.2916666667,
-        "r":0.1944444444,
-        "f":0.2333333333
-      },
-      "parataxis":{
-        "p":0.1428571429,
-        "r":0.0273972603,
-        "f":0.0459770115
-      },
       "case":{
-        "p":0.8905472637,
-        "r":0.9132653061,
-        "f":0.9017632242
       },
       "csubj":{
-        "p":0.3846153846,
         "r":0.2702702703,
-        "f":0.3174603175
       },
       "xcomp":{
-        "p":0.7820512821,
-        "r":0.8243243243,
-        "f":0.8026315789
       },
       "nummod":{
-        "p":0.625,
-        "r":0.376344086,
-        "f":0.4697986577
       },
       "advmod:tto":{
         "p":0.5,
-        "r":0.3,
-        "f":0.375
       },
       "nmod":{
-        "p":0.1666666667,
         "r":0.0909090909,
-        "f":0.1176470588
       },
       "aux":{
-        "p":0.7777777778,
-        "r":0.5833333333,
-        "f":0.6666666667
       },
       "advmod:tfrom":{
         "p":0.0,
         "r":0.0,
         "f":0.0
       },
-      "list":{
-        "p":0.0434782609,
-        "r":0.1666666667,
-        "f":0.0689655172
-      },
       "goeswith":{
         "p":0.0,
         "r":0.0,
         "f":0.0
       },
       "compound":{
-        "p":0.75,
-        "r":0.975,
-        "f":0.847826087
       },
       "obl:lvc":{
         "p":0.0,
         "r":0.0,
         "f":0.0
       },
-      "orphan":{
-        "p":0.0,
-        "r":0.0,
-        "f":0.0
       },
       "ccomp":{
         "p":0.0,
@@ -1584,42 +1589,37 @@
         "f":0.0
       },
       "advmod:que":{
-        "p":0.0,
-        "r":0.0,
-        "f":0.0
-      },
-      "ccomp:pred":{
-        "p":0.0,
-        "r":0.0,
-        "f":0.0
       }
     },
-    "ents_p":0.8557640751,
-    "ents_r":0.8417721519,
-    "ents_f":0.8487104493,
     "ents_per_type":{
       "ORG":{
-        "p":0.8894073728,
-        "r":0.8836346778,
-        "f":0.8865116279
       },
       "PER":{
-        "p":0.8679692126,
-        "r":0.8757467145,
-        "f":0.8718406185
       },
       "LOC":{
-        "p":0.8407376362,
-        "r":0.8706597222,
-        "f":0.8554371002
       },
       "MISC":{
-        "p":0.7245614035,
-        "r":0.5858156028,
-        "f":0.6478431373
       }
     },
-    "speed":2553.5927991195
   },
   "sources":[
     {
@@ -1634,17 +1634,17 @@
       "license":"CC BY-SA 4.0",
       "author":"Eszter Simon, No\u00e9mi Vad\u00e1sz (Department of Language Technology and Applied Linguistics)"
     },
-    {
-      "name":"hunNERwiki",
-      "url":"http://hlt.sztaki.hu/resources/hunnerwiki.html",
-      "license":"CC-BY-SA-3.0",
-      "author":"Eszter Simon, D\u00e1vid M\u00e1rk Nemeskey (HLT Group, Budapest University of Technology and Economics)"
-    },
     {
       "name":"Szeged NER Corpus",
       "url":"https://rgai.inf.u-szeged.hu/node/130",
       "license":"CC-BY-NC-SA-3.0",
       "author":"Gy\u00f6rgy Szarvas, Rich\u00e1rd Farkas, L\u00e1szl\u00f3 Felf\u00f6ldi, Andr\u00e1s Kocsor, J\u00e1nos Csirik (MTA-SZTE Research Group on Artificial Intelligence)"
     }
   ],
   "requirements":[

 {
   "lang":"hu",
   "name":"core_news_md",
+  "version":"3.6.0",
   "description":"Core Hungarian model for HuSpaCy. Components: tok2vec, senter, tagger, morphologizer, lemmatizer, parser, ner",
   "author":"SzegedAI, MILAB",
   "email":"gyorgy@orosz.link",
   "url":"https://github.com/huspacy/huspacy",
   "license":"cc-by-sa-4.0",
+  "spacy_version":">=3.6.0,<3.7.0",
+  "spacy_git_version":"6fc153a26",
   "vectors":{
     "width":100,
     "vectors":200000,
     "sents_p":0.9820627803,
     "sents_r":0.9755011136,
     "sents_f":0.9787709497,
+    "tag_acc":0.9640156953,
+    "pos_acc":0.9655469423,
+    "morph_acc":0.9339649727,
+    "morph_micro_p":0.9693147835,
+    "morph_micro_r":0.9611087237,
+    "morph_micro_f":0.965194312,
     "morph_per_feat":{
       "Definite":{
+        "p":0.9694727105,
+        "r":0.9780681288,
+        "f":0.9737514518
       },
       "PronType":{
+        "p":0.977827051,
+        "r":0.9735099338,
+        "f":0.9756637168
       },
       "Case":{
+        "p":0.9769246071,
+        "r":0.9703615886,
+        "f":0.9736320381
       },
       "Degree":{
+        "p":0.9202834367,
+        "r":0.8643926789,
+        "f":0.8914628915
       },
       "Number":{
+        "p":0.985019357,
+        "r":0.9807273337,
+        "f":0.9828686597
       },
       "Mood":{
+        "p":0.9296703297,
+        "r":0.9379157428,
+        "f":0.9337748344
       },
       "Person":{
+        "p":0.9578163772,
+        "r":0.9523026316,
+        "f":0.9550515464
       },
       "Tense":{
+        "p":0.9681318681,
+        "r":0.973480663,
+        "f":0.9707988981
       },
       "VerbForm":{
+        "p":0.9611486486,
+        "r":0.9125902165,
+        "f":0.9362402304
       },
       "Voice":{
+        "p":0.9634888438,
+        "r":0.9713701431,
+        "f":0.967413442
       },
       "Number[psor]":{
+        "p":0.9709302326,
+        "r":0.9515669516,
+        "f":0.9611510791
       },
       "Person[psor]":{
+        "p":0.9723837209,
+        "r":0.9543509272,
+        "f":0.9632829374
       },
       "NumType":{
+        "p":0.9011764706,
+        "r":0.9341463415,
+        "f":0.9173652695
       },
       "Reflex":{
         "p":1.0,
+        "r":0.875,
+        "f":0.9333333333
       },
       "Aspect":{
         "p":0.0,
         "f":1.0
       }
     },
+    "lemma_acc":0.9730169362,
+    "dep_uas":0.8103583867,
+    "dep_las":0.743357861,
     "dep_las_per_type":{
       "det":{
+        "p":0.8618524333,
+        "r":0.8742038217,
+        "f":0.8679841897
       },
       "amod:att":{
+        "p":0.8163580247,
+        "r":0.8650858545,
+        "f":0.8400158793
       },
       "nsubj":{
+        "p":0.7198748044,
+        "r":0.71875,
+        "f":0.7193119625
       },
       "advmod:mode":{
+        "p":0.5789473684,
+        "r":0.5392156863,
+        "f":0.5583756345
       },
       "nmod:att":{
+        "p":0.7376788553,
+        "r":0.786440678,
+        "f":0.7612797375
       },
       "obl":{
+        "p":0.7789954338,
+        "r":0.7677767777,
+        "f":0.7733454216
       },
       "obj":{
+        "p":0.8280542986,
+        "r":0.8224719101,
+        "f":0.825253664
       },
       "root":{
+        "p":0.8183856502,
+        "r":0.8129175947,
+        "f":0.8156424581
       },
       "cc":{
+        "p":0.7096774194,
+        "r":0.6947368421,
+        "f":0.7021276596
       },
       "conj":{
+        "p":0.4771784232,
+        "r":0.4791666667,
+        "f":0.4781704782
       },
       "advmod":{
+        "p":0.8279569892,
         "r":0.8105263158,
+        "f":0.8191489362
       },
       "flat:name":{
+        "p":0.8451327434,
+        "r":0.8925233645,
+        "f":0.8681818182
       },
       "appos":{
+        "p":0.3837209302,
+        "r":0.3510638298,
+        "f":0.3666666667
       },
       "advcl":{
+        "p":0.2941176471,
+        "r":0.306122449,
+        "f":0.3
       },
       "advmod:tlocy":{
+        "p":0.688034188,
+        "r":0.7,
+        "f":0.6939655172
       },
       "ccomp:obj":{
+        "p":0.3513513514,
+        "r":0.3939393939,
+        "f":0.3714285714
       },
       "mark":{
+        "p":0.8113207547,
+        "r":0.8164556962,
+        "f":0.8138801262
       },
       "compound:preverb":{
+        "p":0.9203539823,
+        "r":0.9541284404,
+        "f":0.9369369369
       },
       "advmod:locy":{
+        "p":0.8235294118,
+        "r":0.4375,
+        "f":0.5714285714
       },
       "cop":{
+        "p":0.6666666667,
+        "r":0.5365853659,
+        "f":0.5945945946
       },
       "nmod:obl":{
+        "p":0.2162162162,
+        "r":0.2,
+        "f":0.2077922078
       },
       "advmod:to":{
         "p":0.0,
         "f":0.0
       },
       "obj:lvc":{
+        "p":0.5,
         "r":0.0833333333,
+        "f":0.1428571429
       },
       "ccomp:obl":{
+        "p":0.28,
+        "r":0.21875,
+        "f":0.2456140351
       },
       "iobj":{
+        "p":0.3157894737,
         "r":0.4,
+        "f":0.3529411765
       },
       "dep":{
         "p":0.0,
         "r":0.0,
         "f":0.0
       },
       "case":{
+        "p":0.9432989691,
+        "r":0.9336734694,
+        "f":0.9384615385
       },
       "csubj":{
+        "p":0.5882352941,
         "r":0.2702702703,
+        "f":0.3703703704
+      },
+      "parataxis":{
+        "p":0.2727272727,
+        "r":0.0410958904,
+        "f":0.0714285714
       },
       "xcomp":{
+        "p":0.8985507246,
+        "r":0.8378378378,
+        "f":0.8671328671
       },
       "nummod":{
+        "p":0.6282051282,
+        "r":0.5268817204,
+        "f":0.5730994152
+      },
+      "acl":{
+        "p":0.3846153846,
+        "r":0.2777777778,
+        "f":0.3225806452
+      },
+      "orphan":{
+        "p":0.0,
+        "r":0.0,
+        "f":0.0
       },
       "advmod:tto":{
         "p":0.5,
+        "r":0.1,
+        "f":0.1666666667
       },
       "nmod":{
+        "p":1.0,
         "r":0.0909090909,
+        "f":0.1666666667
+      },
+      "ccomp:pred":{
+        "p":0.0,
+        "r":0.0,
+        "f":0.0
       },
       "aux":{
+        "p":0.9,
+        "r":0.75,
+        "f":0.8181818182
       },
       "advmod:tfrom":{
         "p":0.0,
         "r":0.0,
         "f":0.0
       },
       "goeswith":{
         "p":0.0,
         "r":0.0,
         "f":0.0
       },
       "compound":{
+        "p":0.9487179487,
+        "r":0.925,
+        "f":0.9367088608
       },
       "obl:lvc":{
         "p":0.0,
         "r":0.0,
         "f":0.0
       },
+      "list":{
+        "p":0.2,
+        "r":0.1666666667,
+        "f":0.1818181818
       },
       "ccomp":{
         "p":0.0,
         "f":0.0
       },
       "advmod:que":{
+        "p":1.0,
+        "r":0.25,
+        "f":0.4
       }
     },
+    "ents_p":0.8479221927,
+    "ents_r":0.8430028129,
+    "ents_f":0.8454553469,
     "ents_per_type":{
       "ORG":{
+        "p":0.882924572,
+        "r":0.8845618915,
+        "f":0.8837424734
       },
       "PER":{
+        "p":0.8772969769,
+        "r":0.8841099164,
+        "f":0.8806902708
       },
       "LOC":{
+        "p":0.84,
+        "r":0.8567708333,
+        "f":0.8483025355
       },
       "MISC":{
+        "p":0.664556962,
+        "r":0.5957446809,
+        "f":0.6282722513
       }
     },
+    "speed":2618.8542210874
   },
   "sources":[
     {
       "license":"CC BY-SA 4.0",
       "author":"Eszter Simon, No\u00e9mi Vad\u00e1sz (Department of Language Technology and Applied Linguistics)"
     },
     {
       "name":"Szeged NER Corpus",
       "url":"https://rgai.inf.u-szeged.hu/node/130",
       "license":"CC-BY-NC-SA-3.0",
       "author":"Gy\u00f6rgy Szarvas, Rich\u00e1rd Farkas, L\u00e1szl\u00f3 Felf\u00f6ldi, Andr\u00e1s Kocsor, J\u00e1nos Csirik (MTA-SZTE Research Group on Artificial Intelligence)"
+    },
+    {
+      "name":"Hungarian lg Floret vectors",
+      "url":"https://huggingface.co/huspacy/hu_vectors_web_lg",
+      "license":"CC-BY-SA-4.0",
+      "author":"Szeged AI"
     }
   ],
   "requirements":[

morphologizer/cfg CHANGED Viewed

@@ -1,5 +1,6 @@
 {
   "extend":false,
   "labels_morph":{
     "Definite=Def|POS=DET|PronType=Art":"Definite=Def|PronType=Art",
     "Case=Ine|Number=Sing|POS=NOUN":"Case=Ine|Number=Sing",

 {
   "extend":false,
+  "label_smoothing":0.0,
   "labels_morph":{
     "Definite=Def|POS=DET|PronType=Art":"Definite=Def|PronType=Art",
     "Case=Ine|Number=Sing|POS=NOUN":"Case=Ine|Number=Sing",

morphologizer/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e6aff4240ac18467b7dc06107b9c062f36f886d7ce23807af3f8406749a7f14b
 size 463022

 version https://git-lfs.github.com/spec/v1
+oid sha256:2d43683d554c8c726ef065c0db115d588004bf892c00d7032b65456ddb0fa6d9
 size 463022

ner/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3ed6dcbe8e6fffa7498e78a2574d8043591cb5d2bb6f9c108fa8e2f1b77f9c30
 size 9791307

 version https://git-lfs.github.com/spec/v1
+oid sha256:364eda709e2edbfac89812efe2353bb8cecd2854ea39f900e1bd98ce6751ea66
 size 9791307

parser/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:78283bea80e3386ef410e1d15c64f01b744d5c5e0fecf2bb19e47229f913fa56
 size 25601129

 version https://git-lfs.github.com/spec/v1
+oid sha256:fee779591ece0e3d7caf9277c67269f4ec014108863356ede7f37ad457ad384f
 size 25601129

senter/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b18414fd9e8488e9a3ddd9526bd4d2def3f89bc86cbc29f42913f292c613fbe1
 size 1237

 version https://git-lfs.github.com/spec/v1
+oid sha256:dfb4dcfe2a876d6bade5bf405e9835efe65bb71092aaa1aa86d1ccdc2b255e0a
 size 1237

tagger/cfg CHANGED Viewed

@@ -1,4 +1,5 @@
 {
   "labels":[
     "ADJ",
     "ADP",

 {
+  "label_smoothing":0.0,
   "labels":[
     "ADJ",
     "ADP",

tagger/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6fb3702150c4d01ca856cdb2e672ebef74bb6fcc26598cd8e9299dbd696544de
 size 7297

 version https://git-lfs.github.com/spec/v1
+oid sha256:632c6f38ad97c0336e65a15ee41d097f45d71233914ea41f2e7010d6af4c89f6
 size 7297

tok2vec/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:688fde3edb6700bbe83c5058ee028879580e4886521245e8bdacea95086b4c7b
 size 9659749

 version https://git-lfs.github.com/spec/v1
+oid sha256:7092f2f38ddf3e799dadff6a131296038901b22d90c44940a6a453104db5fc2e
 size 9659749

trainable_lemmatizer/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d31925eb4ba242c6b1352d8e203416e400ba9cbd06cb709a0caeabd85bac1649
 size 11282980

 version https://git-lfs.github.com/spec/v1
+oid sha256:034f6cf0204dd1b27ebac3b5d66fa99ea8cd96e3df746325e228949186826a20
 size 11282980

vocab/strings.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e84f6f9c6885355eea81dfb3b4e9ca437d1300fcde1cf2895f55aa03f82e8372
-size 6405534

 version https://git-lfs.github.com/spec/v1
+oid sha256:8d5610c17288cd7c1db421eb081e29b13e79705966a21722c748c310f2f1f905
+size 6406437

vocab/vectors.cfg CHANGED Viewed

@@ -5,5 +5,6 @@
   "hash_count":2,
   "hash_seed":2166136261,
   "bow":"<",
-  "eow":">"
 }

   "hash_count":2,
   "hash_seed":2166136261,
   "bow":"<",
+  "eow":">",
+  "attr":65
 }