File size: 18,495 Bytes
4c30b43
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
---
base_model: mini1013/master_domain
library_name: setfit
metrics:
- metric
pipeline_tag: text-classification
tags:
- setfit
- sentence-transformers
- text-classification
- generated_from_setfit_trainer
widget:
- text: 오뚜기 옛날 쇠고기죽 85g  (주) 식자재민족
- text: 오뚜기 맛있는 오뚜기밥 210g x 3개입  (주)푸드엔
- text: 햇반소프트밀 비비고 소고기죽 420g  35 소프트밀 누룽지닭백숙 420g 다여기
- text: 오뚜기 전복죽 용기 285g/즉석죽/간편식 스프-보노_VONO 콘스프 55.8g 모두유통주식회사
- text: 꼴떡꼴떡 자체생산 학교앞 밀떡볶이 어묵포함 밀키트 2인분 일반떡2봉+어묵2봉+소스2봉_까르보나라 맛있는꼴떡꼴떡
inference: true
model-index:
- name: SetFit with mini1013/master_domain
  results:
  - task:
      type: text-classification
      name: Text Classification
    dataset:
      name: Unknown
      type: unknown
      split: test
    metrics:
    - type: metric
      value: 0.867680979418027
      name: Metric
---

# SetFit with mini1013/master_domain

This is a [SetFit](https://github.com/huggingface/setfit) model that can be used for Text Classification. This SetFit model uses [mini1013/master_domain](https://huggingface.co/mini1013/master_domain) as the Sentence Transformer embedding model. A [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

1. Fine-tuning a [Sentence Transformer](https://www.sbert.net) with contrastive learning.
2. Training a classification head with features from the fine-tuned Sentence Transformer.

## Model Details

### Model Description
- **Model Type:** SetFit
- **Sentence Transformer body:** [mini1013/master_domain](https://huggingface.co/mini1013/master_domain)
- **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance
- **Maximum Sequence Length:** 512 tokens
- **Number of Classes:** 21 classes
<!-- - **Training Dataset:** [Unknown](https://huggingface.co/datasets/unknown) -->
<!-- - **Language:** Unknown -->
<!-- - **License:** Unknown -->

### Model Sources

- **Repository:** [SetFit on GitHub](https://github.com/huggingface/setfit)
- **Paper:** [Efficient Few-Shot Learning Without Prompts](https://arxiv.org/abs/2209.11055)
- **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)

### Model Labels
| Label | Examples                                                                                                                                                                                                                 |
|:------|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 15.0  | <ul><li>'청정원 카레여왕 망고바나나 108g 4_청정원 치즈코코넛 108g 고래인터내셔널'</li><li>'청정원 카레여왕 망고 앤 바나나 108g  주식회사 에이치제이인터내셔널'</li><li>'0212. 카레분말(매운맛) - 오뚜기1kg  베이킹도전'</li></ul>                                                             |
| 5.0   | <ul><li>'M&F 몬 월남쌈 사각 200g 16cm 라이스페이퍼  얌얌몰'</li><li>'몬 뉴 월남쌈 300g 원형 라이스페이퍼 16cm 베트남 월남쌈 재료 몬 현미 월남쌈(원형) 200g (주) 바른들식품농업회사법인'</li><li>'몬 월남쌈 원형 라이스페이퍼 200g 1개  coupang'</li></ul>                                     |
| 7.0   | <ul><li>'동원 더킹 크랩스 랍스터맛 오리지널 140g 6개 맛살 샐러드 초밥 스시 김밥용 2.더킹 크랩스 랍스터맛 140g x 6개 (주)에이알커머스'</li><li>'한성 저지방 크래미 180g x 2개입  (주)씨티케이이비전코리아'</li><li>'한성기업 해조칼슘 크래미F 1kg  제루통상'</li></ul>                                     |
| 10.0  | <ul><li>'폰타나 스위트콘 크림 수프 180g 03.그릴드 머쉬룸크림 수프180g-SPPSF 주식회사 삼공오공'</li><li>'오뚜기 양송이 스프 1kg  모아유통'</li><li>'오뚜기 양송이스프 80g(분말) 간편식 가루스프 즉석스프 외 4종 오뚜기 크림스프 80g(분말) 마켓위너'</li></ul>                                          |
| 3.0   | <ul><li>'동원 냉동 해물모듬완자 1kg  제이에이치'</li><li>'(맛나)잡채해물완자 1KG/(주)사조오양  두드림'</li><li>'삼양 모닝하임 동그랑땡 1kg 업소용 대용량 반찬 동그랑땡  금성식품 주식회사'</li></ul>                                                                                  |
| 0.0   | <ul><li>'한성 프리미엄 김밥재료세트 440g(5인분10줄)  포안'</li><li>'냉동 혼합야채 4종 1kg 볶음밥용 야채믹스 농우 냉동 옥수수알 1kg 주식회사 팜'</li><li>'한채원 껍질없는 구운감자 리얼미니 한입 통 감자 150g 리얼미니 구운감자 1팩 농업회사법인 한채원 주식회사'</li></ul>                                      |
| 16.0  | <ul><li>'동원 퀴진 더블치즈스틱 400g x 1개 아이스보냉백포장 오하'</li><li>'애슐리 스윗 콤보 치킨 (냉동) 460g 1개  엠에스 컨설팅'</li><li>'코코스 냉동 닭껍질 튀김 (1kg) 치킨 에어프라이어 (드라이아이스 포장) 05.(유통기한 24.06.22)버팔로봉1kg 잇츠컴퍼니'</li></ul>                                  |
| 4.0   | <ul><li>'cj 초간단 즐거운동행 미정당 쫄볶이 470g 혼밥 술안주 자취 탕비실 간식 야식  두칭구'</li><li>'미미네 국물떡볶이 9봉 + 눈꽃치즈 국물떡볶이 1봉 (총10봉)  브라이트컴퍼니'</li><li>'미미네 오리지널 국물떡볶이 6봉 오리지널 국물떡볶이/눈꽃치즈 국물떡볶이 각3봉 마일드스토어'</li></ul>                               |
| 20.0  | <ul><li>'만복당 대만 샌드위치 햄치즈(냉동) 8개세트 치즈 8입 (주)한국푸드본'</li><li>'한맥식품 직화그릴 더블버거 210g 5개 학생 간식 한맥식품 직화그릴 더블버거 210g 5개 현명한쇼핑'</li><li>'만복당 대만 샌드위치 햄치즈(냉동) 18개X5세트 = 총90개/개당1,650원 햄(18입X5세트) (주)한국푸드본'</li></ul>                |
| 11.0  | <ul><li>'어묵장인 박경도의 어묵탕 x10봉  바이투'</li><li>'영자어묵 오리지널 사각 꼬치 캠핑 부산 어묵 오뎅 오뎅탕 밀키트 350g(10개입)  주식회사 금진식품'</li><li>'삼호 부산 어묵 어묵채 1kg 잡채 김밥 볶음용 CJ씨푸드 삼호부산어묵 어묵채 1kg 주식회사 팜'</li></ul>                                         |
| 17.0  | <ul><li>'피자씨티 페스츄리도우 8인치(125g) 25매팩 2박스  피자씨티'</li><li>'한성 롤스틱 치즈 80g  주식회사 명일푸드'</li><li>'파파스 씬도우 10인치 15장 씬피자도우 4종 11인치(11월초입고예정) D.S글로벌비즈'</li></ul>                                                                  |
| 18.0  | <ul><li>'아워홈 버거 헌터 함박 스테이크 2인분 400g  (주)아워홈'</li><li>'삼양새아침 더블 함박스테이크 1kg  유한회사 365푸드'</li><li>'고기대신 식물성 베지 바베큐맛 미트볼 300g  주식회사 알티스트'</li></ul>                                                                          |
| 2.0   | <ul><li>'하림이닭 다이어트 탄단지 도시락 김치볶음밥과 비엔나소시지 210g 5팩 외 7종 귀리밥과 가라아게 210g 5팩 주식회사 하림'</li><li>'허닭 다이어트 냉동 도시락 210g 4종 4팩 다이어트 도시락 베이컨잡곡 4팩 주식회사 허닭'</li><li>'아워홈 온더고 소고기 오색비빔밥 310g 아워홈 온더고 로제파스타 미니함박290g 주식회사 은하'</li></ul> |
| 19.0  | <ul><li>'고메 통모짜 크리스피 핫도그 340g 3개 총 12입  라이프스마트'</li><li>'Chefood 우유핫도그 70gx20개 우유핫도그 70gx10개 우유핫도그 70gx10개_우유핫도그 70gx10개 용진건재'</li><li>'하림 스위트 핫도그 1kg 닭가슴살핫도그 450g 성원종합유통'</li></ul>                                    |
| 14.0  | <ul><li>'비비고 김치치즈 주먹밥 500Gx3개  미루시스템'</li><li>'네이처엠 현미밥 150g X 24개 미동의 제이엠세일즈'</li><li>'384369 오뚜기 맛있는 오뚜기밥 200g 3개 /즉석밥/컵밥/햇반/간편밥/휴대용 오뚜기 진비빔면 159g 4개 (1봉지) /멀 제이엠무역'</li></ul>                                        |
| 12.0  | <ul><li>'[2+1 골라담기] 동원 양반 전복죽 420g 총 3개 외 9종 [2+1] 양반 참치죽 420g 총3개 (주)에이알커머스'</li><li>'동원 양반죽 쇠고기죽 파우치 외3종 양반볶음김치 비에이'</li><li>'동원 양반죽 참치 285g 동원양반죽_참치 대제종합물류센터'</li></ul>                                              |
| 13.0  | <ul><li>'장사의신 내장탕 750g  장사의 신 컴퍼니'</li><li>'소문난 비비고 돼지고기김치찌개 460g CJ제일제당 간편식 요리레시피 감칠맛업 홈파티음식 캠핑요리 집밥  에스더블유디자인'</li><li>'명장 김치찌개 김치찜 250g 2개입 8개입 주식회사라이프키친'</li></ul>                                                  |
| 6.0   | <ul><li>'CJ 간편요리 간편식 밀키트 비비고 깻잎고기만두400gx2 전골 라면 술안주 반찬  서화tc'</li><li>'CJ 간편요리 간편식 밀키트 비비고 청양고기만두 400gx2 전골 라면 술안주 반찬  서화tc'</li><li>'CJ [식물성]비비고 밥반찬 플랜테이블왕교자 385g 즉석 간단 간편요리 나혼산 혼밥 엄마밥  인영'</li></ul>                 |
| 9.0   | <ul><li>'삼립 참치마요 스쿱 샐러드 700G 아이스박스포장 에이알비'</li><li>'샐러드미인 대용량 에그포테이토 샐러드 토핑 1kg 콘버터 1kg 엠디에스마케팅 주식회사'</li><li>'피코크 에그 포테이토 샐러드 500g x 1개 종이박스포장 에이알비'</li></ul>                                                          |
| 1.0   | <ul><li>'국내산 수제 현미누룽지 검정깨누룽지 1봉 주식회사 우리곡간'</li><li>'비알푸드 숭늉이 구수한 가마솥 누아미 누룽지 350g 비알푸드 누아미누룽지팝 50gX3봉 드림스토어'</li><li>'가화푸드 지평선 현미누룽지 150g x 10개입 김제평야 햅쌀 국내산 현미  가화푸드'</li></ul>                                         |
| 8.0   | <ul><li>'마라 곤약 마라맛 곤약 매운맛 간식 중국 향라맛 향라2 쑤안라1 라비엔또'</li><li>'도토리건조묵 100gx2  바니스타일'</li><li>'도토리묵가루 500gx1  바니스타일'</li></ul>                                                                                               |

## Evaluation

### Metrics
| Label   | Metric |
|:--------|:-------|
| **all** | 0.8677 |

## Uses

### Direct Use for Inference

First install the SetFit library:

```bash
pip install setfit
```

Then you can load this model and run inference.

```python
from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("mini1013/master_cate_fd4")
# Run inference
preds = model("오뚜기 옛날 쇠고기죽 85g  (주) 식자재민족")
```

<!--
### Downstream Use

*List how someone could finetune this model on their own dataset.*
-->

<!--
### Out-of-Scope Use

*List how the model may foreseeably be misused and address what users ought not to do with the model.*
-->

<!--
## Bias, Risks and Limitations

*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
-->

<!--
### Recommendations

*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
-->

## Training Details

### Training Set Metrics
| Training set | Min | Median | Max |
|:-------------|:----|:-------|:----|
| Word count   | 3   | 9.5276 | 26  |

| Label | Training Sample Count |
|:------|:----------------------|
| 0.0   | 50                    |
| 1.0   | 50                    |
| 2.0   | 50                    |
| 3.0   | 50                    |
| 4.0   | 50                    |
| 5.0   | 50                    |
| 6.0   | 50                    |
| 7.0   | 50                    |
| 8.0   | 50                    |
| 9.0   | 50                    |
| 10.0  | 50                    |
| 11.0  | 50                    |
| 12.0  | 50                    |
| 13.0  | 50                    |
| 14.0  | 50                    |
| 15.0  | 50                    |
| 16.0  | 50                    |
| 17.0  | 50                    |
| 18.0  | 50                    |
| 19.0  | 50                    |
| 20.0  | 50                    |

### Training Hyperparameters
- batch_size: (512, 512)
- num_epochs: (20, 20)
- max_steps: -1
- sampling_strategy: oversampling
- num_iterations: 40
- body_learning_rate: (2e-05, 2e-05)
- head_learning_rate: 2e-05
- loss: CosineSimilarityLoss
- distance_metric: cosine_distance
- margin: 0.25
- end_to_end: False
- use_amp: False
- warmup_proportion: 0.1
- seed: 42
- eval_max_steps: -1
- load_best_model_at_end: False

### Training Results
| Epoch   | Step | Training Loss | Validation Loss |
|:-------:|:----:|:-------------:|:---------------:|
| 0.0061  | 1    | 0.4265        | -               |
| 0.3030  | 50   | 0.3323        | -               |
| 0.6061  | 100  | 0.234         | -               |
| 0.9091  | 150  | 0.1134        | -               |
| 1.2121  | 200  | 0.0641        | -               |
| 1.5152  | 250  | 0.0509        | -               |
| 1.8182  | 300  | 0.0435        | -               |
| 2.1212  | 350  | 0.0309        | -               |
| 2.4242  | 400  | 0.0191        | -               |
| 2.7273  | 450  | 0.0163        | -               |
| 3.0303  | 500  | 0.0215        | -               |
| 3.3333  | 550  | 0.0161        | -               |
| 3.6364  | 600  | 0.024         | -               |
| 3.9394  | 650  | 0.006         | -               |
| 4.2424  | 700  | 0.0116        | -               |
| 4.5455  | 750  | 0.0061        | -               |
| 4.8485  | 800  | 0.0025        | -               |
| 5.1515  | 850  | 0.001         | -               |
| 5.4545  | 900  | 0.0003        | -               |
| 5.7576  | 950  | 0.0002        | -               |
| 6.0606  | 1000 | 0.0002        | -               |
| 6.3636  | 1050 | 0.0001        | -               |
| 6.6667  | 1100 | 0.0002        | -               |
| 6.9697  | 1150 | 0.0002        | -               |
| 7.2727  | 1200 | 0.0001        | -               |
| 7.5758  | 1250 | 0.0001        | -               |
| 7.8788  | 1300 | 0.0001        | -               |
| 8.1818  | 1350 | 0.0001        | -               |
| 8.4848  | 1400 | 0.0001        | -               |
| 8.7879  | 1450 | 0.0001        | -               |
| 9.0909  | 1500 | 0.0001        | -               |
| 9.3939  | 1550 | 0.0001        | -               |
| 9.6970  | 1600 | 0.0001        | -               |
| 10.0    | 1650 | 0.0001        | -               |
| 10.3030 | 1700 | 0.0001        | -               |
| 10.6061 | 1750 | 0.0001        | -               |
| 10.9091 | 1800 | 0.0001        | -               |
| 11.2121 | 1850 | 0.0001        | -               |
| 11.5152 | 1900 | 0.0001        | -               |
| 11.8182 | 1950 | 0.0001        | -               |
| 12.1212 | 2000 | 0.0001        | -               |
| 12.4242 | 2050 | 0.0001        | -               |
| 12.7273 | 2100 | 0.0001        | -               |
| 13.0303 | 2150 | 0.0001        | -               |
| 13.3333 | 2200 | 0.0001        | -               |
| 13.6364 | 2250 | 0.0001        | -               |
| 13.9394 | 2300 | 0.0001        | -               |
| 14.2424 | 2350 | 0.0           | -               |
| 14.5455 | 2400 | 0.0           | -               |
| 14.8485 | 2450 | 0.0001        | -               |
| 15.1515 | 2500 | 0.0           | -               |
| 15.4545 | 2550 | 0.0001        | -               |
| 15.7576 | 2600 | 0.0           | -               |
| 16.0606 | 2650 | 0.0           | -               |
| 16.3636 | 2700 | 0.0001        | -               |
| 16.6667 | 2750 | 0.0001        | -               |
| 16.9697 | 2800 | 0.0001        | -               |
| 17.2727 | 2850 | 0.0001        | -               |
| 17.5758 | 2900 | 0.0001        | -               |
| 17.8788 | 2950 | 0.0001        | -               |
| 18.1818 | 3000 | 0.0           | -               |
| 18.4848 | 3050 | 0.0           | -               |
| 18.7879 | 3100 | 0.0001        | -               |
| 19.0909 | 3150 | 0.0           | -               |
| 19.3939 | 3200 | 0.0001        | -               |
| 19.6970 | 3250 | 0.0           | -               |
| 20.0    | 3300 | 0.0           | -               |

### Framework Versions
- Python: 3.10.12
- SetFit: 1.1.0.dev0
- Sentence Transformers: 3.1.1
- Transformers: 4.46.1
- PyTorch: 2.4.0+cu121
- Datasets: 2.20.0
- Tokenizers: 0.20.0

## Citation

### BibTeX
```bibtex
@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}
```

<!--
## Glossary

*Clearly define terms in order to be accessible across audiences.*
-->

<!--
## Model Card Authors

*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
-->

<!--
## Model Card Contact

*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
-->