Add SetFit ABSA model

Browse files

Files changed (5) hide show

README.md +66 -71
config_sentence_transformers.json +1 -1
config_setfit.json +3 -4
model.safetensors +1 -1
model_head.pkl +2 -2

README.md CHANGED Viewed

@@ -10,18 +10,20 @@ base_model: cointegrated/rubert-tiny2
 metrics:
 - accuracy
 widget:
-- text: Посетили вчера Твинс с подругой ,:Посетили вчера Твинс с подругой , в целом
-    все очень понравилось ! !
-- text: ', что это кафе для тех ,:По кухне можно сказать , что это кафе для тех ,
-    кто любит соотношение цены и качества .'
-- text: особенно шашлыки и наполеон . ( спасибо:Готовят очень вкусно , особенно шашлыки
-    и наполеон . ( спасибо большое поварам )
-- text: 'свет , ненавязчивая музыка ( даже как:Интерьер приятный : есть гардероб ,
-    диваны , приглушенный свет , ненавязчивая музыка ( даже как - то раз наткнулись
-    там на саксофониста ) , приятная атмосфера . . .'
-- text: 'отдельно : есть официанты , которые работают:По обслуживание отдельно : есть
-    официанты , которые работают с самого открытия - это тоже неплохой показатель
-    качества .'
 pipeline_tag: text-classification
 inference: false
 ---
@@ -47,11 +49,11 @@ This model was trained within the context of a larger system for ABSA, which loo
 - **Model Type:** SetFit
 - **Sentence Transformer body:** [cointegrated/rubert-tiny2](https://huggingface.co/cointegrated/rubert-tiny2)
 - **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance
-- **spaCy Model:** en_core_web_lg
 - **SetFitABSA Aspect Model:** [isolation-forest/setfit-absa-aspect](https://huggingface.co/isolation-forest/setfit-absa-aspect)
 - **SetFitABSA Polarity Model:** [isolation-forest/setfit-absa-polarity](https://huggingface.co/isolation-forest/setfit-absa-polarity)
 - **Maximum Sequence Length:** 2048 tokens
-- **Number of Classes:** 3 classes
 <!-- - **Training Dataset:** [Unknown](https://huggingface.co/datasets/unknown) -->
 <!-- - **Language:** Unknown -->
 <!-- - **License:** Unknown -->
@@ -63,11 +65,10 @@ This model was trained within the context of a larger system for ABSA, which loo
 - **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)
 ### Model Labels
-| Label    | Examples                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  |
-|:---------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
-| Positive | <ul><li>'Обслуживание хорошее нас встретил:Обслуживание хорошее нас встретил метрдотель и провёл до столика который отлично нам подашел .'</li><li>'хорошее нас встретил метрдотель и провёл до:Обслуживание хорошее нас встретил метрдотель и провёл до столика который отлично нам подашел .'</li><li>'был в уютном уголке в конце главного:Он был в уютном уголке в конце главного зала , приглушенный свет это основная часть этого ресторана там нет дневного освещения это было большим плюсом для нашего дня рожденья !'</li></ul>                                                 |
-| Neutral  | <ul><li>'По поводу интерьера : место спокойное:По поводу интерьера : место спокойное , шумных компаний нет ( не было , по крайней мере , в момент нашего посещения ) , очень приятная и уютная атмосфера , все в лучших традициях .'</li><li>'поводу интерьера : место спокойное , шумных:По поводу интерьера : место спокойное , шумных компаний нет ( не было , по крайней мере , в момент нашего посещения ) , очень приятная и уютная атмосфера , все в лучших традициях .'</li><li>'Интерьер не плохой ,:Интерьер не плохой , несколько залов на разный вкус и компанию .'</li></ul> |
-| Negative | <ul><li>'как в работе официантов так и в:Очень много недочетов как в работе официантов так и в блюдах . 1 .'</li><li>'так и в блюдах . 1 .:Очень много недочетов как в работе официантов так и в блюдах . 1 .'</li><li>'К большому удивлению пицца ( ещё раз:К большому удивлению пицца ( ещё раз - из детского меню ! ) была на столько острая , что и взрослые не смогли её есть , не говоря уже о ребенке .'</li></ul>                                                                                                                                                                 |
 ## Uses
@@ -122,13 +123,12 @@ preds = model("The food was great, but the venue is just way too busy.")
 ### Training Set Metrics
 | Training set | Min | Median  | Max |
 |:-------------|:----|:--------|:----|
-| Word count   | 5   | 27.2578 | 171 |
 | Label    | Training Sample Count |
 |:---------|:----------------------|
-| Negative | 54                    |
-| Neutral  | 19                    |
-| Positive | 183                   |
 ### Training Hyperparameters
 - batch_size: (16, 2)
@@ -150,58 +150,53 @@ preds = model("The food was great, but the venue is just way too busy.")
 ### Training Results
 | Epoch  | Step | Training Loss | Validation Loss |
 |:------:|:----:|:-------------:|:---------------:|
-| 0.0004 | 1    | 0.2493        | -               |
-| 0.0216 | 50   | 0.2343        | -               |
-| 0.0432 | 100  | 0.2786        | -               |
-| 0.0648 | 150  | 0.1976        | -               |
-| 0.0864 | 200  | 0.2           | -               |
-| 0.1080 | 250  | 0.1894        | -               |
-| 0.1296 | 300  | 0.081         | -               |
-| 0.1513 | 350  | 0.1189        | -               |
-| 0.1729 | 400  | 0.0279        | -               |
-| 0.1945 | 450  | 0.0755        | -               |
-| 0.2161 | 500  | 0.0436        | -               |
-| 0.2377 | 550  | 0.0231        | -               |
-| 0.2593 | 600  | 0.0088        | -               |
-| 0.2809 | 650  | 0.0686        | -               |
-| 0.3025 | 700  | 0.0138        | -               |
-| 0.3241 | 750  | 0.0137        | -               |
-| 0.3457 | 800  | 0.0087        | -               |
-| 0.3673 | 850  | 0.0131        | -               |
-| 0.3889 | 900  | 0.0245        | -               |
-| 0.4105 | 950  | 0.0093        | -               |
-| 0.4322 | 1000 | 0.0036        | -               |
-| 0.4538 | 1050 | 0.0149        | -               |
-| 0.4754 | 1100 | 0.02          | -               |
-| 0.4970 | 1150 | 0.0387        | -               |
-| 0.5186 | 1200 | 0.017         | -               |
-| 0.5402 | 1250 | 0.0417        | -               |
-| 0.5618 | 1300 | 0.0041        | -               |
-| 0.5834 | 1350 | 0.0041        | -               |
-| 0.6050 | 1400 | 0.0282        | -               |
-| 0.6266 | 1450 | 0.0102        | -               |
-| 0.6482 | 1500 | 0.0037        | -               |
-| 0.6698 | 1550 | 0.0058        | -               |
-| 0.6914 | 1600 | 0.0078        | -               |
-| 0.7131 | 1650 | 0.0272        | -               |
-| 0.7347 | 1700 | 0.0224        | -               |
-| 0.7563 | 1750 | 0.0057        | -               |
-| 0.7779 | 1800 | 0.0026        | -               |
-| 0.7995 | 1850 | 0.0088        | -               |
-| 0.8211 | 1900 | 0.0044        | -               |
-| 0.8427 | 1950 | 0.005         | -               |
-| 0.8643 | 2000 | 0.0026        | -               |
-| 0.8859 | 2050 | 0.0072        | -               |
-| 0.9075 | 2100 | 0.0033        | -               |
-| 0.9291 | 2150 | 0.0047        | -               |
-| 0.9507 | 2200 | 0.0048        | -               |
-| 0.9723 | 2250 | 0.0042        | -               |
-| 0.9939 | 2300 | 0.0043        | -               |
 ### Framework Versions
 - Python: 3.10.13
 - SetFit: 1.0.3
-- Sentence Transformers: 2.6.1
 - spaCy: 3.7.2
 - Transformers: 4.39.3
 - PyTorch: 2.1.2

 metrics:
 - accuracy
 widget:
+- text: а л а палтуса запеченного – х о:П о п р о б о в а л а палтуса запеченного
+    – х о р о ш , д а и к р а с и в о с м о т р и т с я н а т а р е л к е .
+- text: 'с курицей , лосось со шпинатным соусом , чай облепиховый:При каждом новом
+    посещении я стараюсь пробовать новые блюда из меню , особенно мне понравились
+    : цезарь с курицей , лосось со шпинатным соусом , чай облепиховый и тирамису от
+    шеф повара .'
+- text: ', но качество еды ее не украсило:Свадьба , конечно , прошла весело , но качество
+    еды ее не украсило .'
+- text: найти уютное недорогое местечко в районе метро:Думаю , если стоит задача найти
+    уютное недорогое местечко в районе метро московская , то это наверно один из лучших
+    вариантов .
+- text: они начали разнообразить кухню мясными блюдами ,:Хочется , чтобы мой отзыв
+    дошел до администрации , и они начали разнообразить кухню мясными блюдами , гарнирами
+    , интересными салатами и супами .
 pipeline_tag: text-classification
 inference: false
 ---
 - **Model Type:** SetFit
 - **Sentence Transformer body:** [cointegrated/rubert-tiny2](https://huggingface.co/cointegrated/rubert-tiny2)
 - **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance
+- **spaCy Model:** ru_core_news_lg
 - **SetFitABSA Aspect Model:** [isolation-forest/setfit-absa-aspect](https://huggingface.co/isolation-forest/setfit-absa-aspect)
 - **SetFitABSA Polarity Model:** [isolation-forest/setfit-absa-polarity](https://huggingface.co/isolation-forest/setfit-absa-polarity)
 - **Maximum Sequence Length:** 2048 tokens
+- **Number of Classes:** 2 classes
 <!-- - **Training Dataset:** [Unknown](https://huggingface.co/datasets/unknown) -->
 <!-- - **Language:** Unknown -->
 <!-- - **License:** Unknown -->
 - **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)
 ### Model Labels
+| Label    | Examples                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                   |
+|:---------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
+| Positive | <ul><li>'И порции " достойные ":И порции " достойные " .'</li><li>'Салаты вообще оказались вкуснейшими:Салаты вообще оказались вкуснейшими .'</li><li>'порадовала , большая пивная тарелка , действительно оказалась:Кухня порадовала , большая пивная тарелка , действительно оказалась большой и вкусной !'</li></ul>                                                                                                                                                                                                                                                                                                    |
+| Negative | <ul><li>'Потом официантка как будто пропала:Потом официантка как будто пропала , было не дозваться , чтобы что - то дозаказать , очень долго приходилось ждать , в итоге посчитали неправильно , в счет внесли на 2 пункта больше , чем мы заказывали .'</li><li>'Обслуживание не впечатлило .:Обслуживание не впечатлило .'</li><li>'приятно удивлена " китайским интерьером " - диванчики:Была приятно удивлена " китайским интерьером " - диванчики как в бистро , скатерти на столах по типу а - ля столовая , европейские светильники / люстры , в общем в плане интерьера китайского никакого абсолютно !'</li></ul> |
 ## Uses
 ### Training Set Metrics
 | Training set | Min | Median  | Max |
 |:-------------|:----|:--------|:----|
+| Word count   | 3   | 28.4766 | 92  |
 | Label    | Training Sample Count |
 |:---------|:----------------------|
+| Negative | 128                   |
+| Positive | 128                   |
 ### Training Hyperparameters
 - batch_size: (16, 2)
 ### Training Results
 | Epoch  | Step | Training Loss | Validation Loss |
 |:------:|:----:|:-------------:|:---------------:|
+| 0.0005 | 1    | 0.2196        | -               |
+| 0.0242 | 50   | 0.2339        | -               |
+| 0.0484 | 100  | 0.2258        | -               |
+| 0.0727 | 150  | 0.246         | -               |
+| 0.0969 | 200  | 0.1963        | -               |
+| 0.1211 | 250  | 0.18          | -               |
+| 0.1453 | 300  | 0.1176        | -               |
+| 0.1696 | 350  | 0.0588        | -               |
+| 0.1938 | 400  | 0.0482        | -               |
+| 0.2180 | 450  | 0.1131        | -               |
+| 0.2422 | 500  | 0.0134        | -               |
+| 0.2665 | 550  | 0.0415        | -               |
+| 0.2907 | 600  | 0.0144        | -               |
+| 0.3149 | 650  | 0.012         | -               |
+| 0.3391 | 700  | 0.0091        | -               |
+| 0.3634 | 750  | 0.0055        | -               |
+| 0.3876 | 800  | 0.0054        | -               |
+| 0.4118 | 850  | 0.0055        | -               |
+| 0.4360 | 900  | 0.0072        | -               |
+| 0.4603 | 950  | 0.0094        | -               |
+| 0.4845 | 1000 | 0.0054        | -               |
+| 0.5087 | 1050 | 0.0045        | -               |
+| 0.5329 | 1100 | 0.003         | -               |
+| 0.5572 | 1150 | 0.0067        | -               |
+| 0.5814 | 1200 | 0.0041        | -               |
+| 0.6056 | 1250 | 0.0048        | -               |
+| 0.6298 | 1300 | 0.0053        | -               |
+| 0.6541 | 1350 | 0.0048        | -               |
+| 0.6783 | 1400 | 0.0038        | -               |
+| 0.7025 | 1450 | 0.0037        | -               |
+| 0.7267 | 1500 | 0.0031        | -               |
+| 0.7510 | 1550 | 0.0038        | -               |
+| 0.7752 | 1600 | 0.0032        | -               |
+| 0.7994 | 1650 | 0.0039        | -               |
+| 0.8236 | 1700 | 0.0032        | -               |
+| 0.8479 | 1750 | 0.0023        | -               |
+| 0.8721 | 1800 | 0.0029        | -               |
+| 0.8963 | 1850 | 0.0041        | -               |
+| 0.9205 | 1900 | 0.0026        | -               |
+| 0.9448 | 1950 | 0.0027        | -               |
+| 0.9690 | 2000 | 0.0035        | -               |
+| 0.9932 | 2050 | 0.003         | -               |
 ### Framework Versions
 - Python: 3.10.13
 - SetFit: 1.0.3
+- Sentence Transformers: 2.7.0
 - spaCy: 3.7.2
 - Transformers: 4.39.3
 - PyTorch: 2.1.2

config_sentence_transformers.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "__version__": {
-    "sentence_transformers": "2.6.1",
     "transformers": "4.39.3",
     "pytorch": "2.1.2"
   },

 {
   "__version__": {
+    "sentence_transformers": "2.7.0",
     "transformers": "4.39.3",
     "pytorch": "2.1.2"
   },

config_setfit.json CHANGED Viewed

@@ -1,10 +1,9 @@
 {
-  "spacy_model": "en_core_web_lg",
-  "span_context": 3,
   "labels": [
     "Negative",
-    "Neutral",
     "Positive"
   ],
-  "normalize_embeddings": false
 }

 {
+  "spacy_model": "ru_core_news_lg",
   "labels": [
     "Negative",
     "Positive"
   ],
+  "normalize_embeddings": false,
+  "span_context": 3
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:90b6e9531d682448e17bce1556afe812d825b50690f20c992340e8d76cb07adc
 size 116781184

 version https://git-lfs.github.com/spec/v1
+oid sha256:74662c65ee63b0fd558a7b2223fa5df50082cb515d3767a495971ba94770353b
 size 116781184

model_head.pkl CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2fcaa9b95e91a59691a442788cdb7e2fb9b979dad928fe94df42129686ad7c33
-size 8431

 version https://git-lfs.github.com/spec/v1
+oid sha256:b0d79bc7edf9389f04a1b1d034cbbd9d5f5e009c7d403fdee370b2fe9d01c7dd
+size 3391