--- base_model: mini1013/master_domain library_name: setfit metrics: - metric pipeline_tag: text-classification tags: - setfit - sentence-transformers - text-classification - generated_from_setfit_trainer widget: - text: 오뚜기 옛날 쇠고기죽 85g (주) 식자재민족 - text: 오뚜기 맛있는 오뚜기밥 210g x 3개입 (주)푸드엔 - text: 햇반소프트밀 비비고 소고기죽 420g 외 35종 소프트밀 누룽지닭백숙 420g 다여기 - text: 오뚜기 전복죽 용기 285g/즉석죽/간편식 스프-보노_VONO 콘스프 55.8g 모두유통주식회사 - text: 꼴떡꼴떡 자체생산 학교앞 밀떡볶이 어묵포함 밀키트 2인분 일반떡2봉+어묵2봉+소스2봉_까르보나라 맛있는꼴떡꼴떡 inference: true model-index: - name: SetFit with mini1013/master_domain results: - task: type: text-classification name: Text Classification dataset: name: Unknown type: unknown split: test metrics: - type: metric value: 0.867680979418027 name: Metric --- # SetFit with mini1013/master_domain This is a [SetFit](https://github.com/huggingface/setfit) model that can be used for Text Classification. This SetFit model uses [mini1013/master_domain](https://huggingface.co/mini1013/master_domain) as the Sentence Transformer embedding model. A [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance is used for classification. The model has been trained using an efficient few-shot learning technique that involves: 1. Fine-tuning a [Sentence Transformer](https://www.sbert.net) with contrastive learning. 2. Training a classification head with features from the fine-tuned Sentence Transformer. ## Model Details ### Model Description - **Model Type:** SetFit - **Sentence Transformer body:** [mini1013/master_domain](https://huggingface.co/mini1013/master_domain) - **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance - **Maximum Sequence Length:** 512 tokens - **Number of Classes:** 21 classes ### Model Sources - **Repository:** [SetFit on GitHub](https://github.com/huggingface/setfit) - **Paper:** [Efficient Few-Shot Learning Without Prompts](https://arxiv.org/abs/2209.11055) - **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit) ### Model Labels | Label | Examples | |:------|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | 15.0 |

'청정원 카레여왕 망고바나나 108g 4_청정원 치즈코코넛 108g 고래인터내셔널'
'청정원 카레여왕 망고 앤 바나나 108g 주식회사 에이치제이인터내셔널'
'0212. 카레분말(매운맛) - 오뚜기1kg 베이킹도전'

| | 5.0 |

'M&F 몬 월남쌈 사각 200g 16cm 라이스페이퍼 얌얌몰'
'몬 뉴 월남쌈 300g 원형 라이스페이퍼 16cm 베트남 월남쌈 재료 몬 현미 월남쌈(원형) 200g (주) 바른들식품농업회사법인'
'몬 월남쌈 원형 라이스페이퍼 200g 1개 coupang'

| | 7.0 |

'동원 더킹 크랩스 랍스터맛 오리지널 140g 6개 맛살 샐러드 초밥 스시 김밥용 2.더킹 크랩스 랍스터맛 140g x 6개 (주)에이알커머스'
'한성 저지방 크래미 180g x 2개입 (주)씨티케이이비전코리아'
'한성기업 해조칼슘 크래미F 1kg 제루통상'

| | 10.0 |

'폰타나 스위트콘 크림 수프 180g 03.그릴드 머쉬룸크림 수프180g-SPPSF 주식회사 삼공오공'
'오뚜기 양송이 스프 1kg 모아유통'
'오뚜기 양송이스프 80g(분말) 간편식 가루스프 즉석스프 외 4종 오뚜기 크림스프 80g(분말) 마켓위너'

| | 3.0 |

'동원 냉동 해물모듬완자 1kg 제이에이치'
'(맛나)잡채해물완자 1KG/(주)사조오양 두드림'
'삼양 모닝하임 동그랑땡 1kg 업소용 대용량 반찬 동그랑땡 금성식품 주식회사'

| | 0.0 |

'한성 프리미엄 김밥재료세트 440g(5인분10줄) 포안'
'냉동 혼합야채 4종 1kg 볶음밥용 야채믹스 농우 냉동 옥수수알 1kg 주식회사 팜'
'한채원 껍질없는 구운감자 리얼미니 한입 통 감자 150g 리얼미니 구운감자 1팩 농업회사법인 한채원 주식회사'

| | 16.0 |

'동원 퀴진 더블치즈스틱 400g x 1개 아이스보냉백포장 오하'
'애슐리 스윗 콤보 치킨 (냉동) 460g 1개 엠에스 컨설팅'
'코코스 냉동 닭껍질 튀김 (1kg) 치킨 에어프라이어 (드라이아이스 포장) 05.(유통기한 24.06.22)버팔로봉1kg 잇츠컴퍼니'

| | 4.0 |

'cj 초간단 즐거운동행 미정당 쫄볶이 470g 혼밥 술안주 자취 탕비실 간식 야식 두칭구'
'미미네 국물떡볶이 9봉 + 눈꽃치즈 국물떡볶이 1봉 (총10봉) 브라이트컴퍼니'
'미미네 오리지널 국물떡볶이 6봉 오리지널 국물떡볶이/눈꽃치즈 국물떡볶이 각3봉 마일드스토어'

| | 20.0 |

'만복당 대만 샌드위치 햄치즈(냉동) 8개세트 치즈 8입 (주)한국푸드본'
'한맥식품 직화그릴 더블버거 210g 5개 학생 간식 한맥식품 직화그릴 더블버거 210g 5개 현명한쇼핑'
'만복당 대만 샌드위치 햄치즈(냉동) 18개X5세트 = 총90개/개당1,650원 햄(18입X5세트) (주)한국푸드본'

| | 11.0 |

'어묵장인 박경도의 어묵탕 x10봉 바이투'
'영자어묵 오리지널 사각 꼬치 캠핑 부산 어묵 오뎅 오뎅탕 밀키트 350g(10개입) 주식회사 금진식품'
'삼호 부산 어묵 어묵채 1kg 잡채 김밥 볶음용 CJ씨푸드 삼호부산어묵 어묵채 1kg 주식회사 팜'

| | 17.0 |

'피자씨티 페스츄리도우 8인치(125g) 25매팩 2박스 피자씨티'
'한성 롤스틱 치즈 80g 주식회사 명일푸드'
'파파스 씬도우 10인치 15장 씬피자도우 4종 11인치(11월초입고예정) D.S글로벌비즈'

| | 18.0 |

'아워홈 버거 헌터 함박 스테이크 2인분 400g (주)아워홈'
'삼양새아침 더블 함박스테이크 1kg 유한회사 365푸드'
'고기대신 식물성 베지 바베큐맛 미트볼 300g 주식회사 알티스트'

| | 2.0 |

'하림이닭 다이어트 탄단지 도시락 김치볶음밥과 비엔나소시지 210g 5팩 외 7종 귀리밥과 가라아게 210g 5팩 주식회사 하림'
'허닭 다이어트 냉동 도시락 210g 4종 4팩 다이어트 도시락 베이컨잡곡 4팩 주식회사 허닭'
'아워홈 온더고 소고기 오색비빔밥 310g 아워홈 온더고 로제파스타 미니함박290g 주식회사 은하'

| | 19.0 |

'고메 통모짜 크리스피 핫도그 340g 3개 총 12입 라이프스마트'
'Chefood 우유핫도그 70gx20개 우유핫도그 70gx10개 우유핫도그 70gx10개_우유핫도그 70gx10개 용진건재'
'하림 스위트 핫도그 1kg 닭가슴살핫도그 450g 성원종합유통'

| | 14.0 |

'비비고 김치치즈 주먹밥 500Gx3개 미루시스템'
'네이처엠 현미밥 150g X 24개 미동의 제이엠세일즈'
'384369 오뚜기 맛있는 오뚜기밥 200g 3개 /즉석밥/컵밥/햇반/간편밥/휴대용 오뚜기 진비빔면 159g 4개 (1봉지) /멀 제이엠무역'

| | 12.0 |

'[2+1 골라담기] 동원 양반 전복죽 420g 총 3개 외 9종 [2+1] 양반 참치죽 420g 총3개 (주)에이알커머스'
'동원 양반죽 쇠고기죽 파우치 외3종 양반볶음김치 비에이'
'동원 양반죽 참치 285g 동원양반죽_참치 대제종합물류센터'

| | 13.0 |

'장사의신 내장탕 750g 장사의 신 컴퍼니'
'소문난 비비고 돼지고기김치찌개 460g CJ제일제당 간편식 요리레시피 감칠맛업 홈파티음식 캠핑요리 집밥 에스더블유디자인'
'명장 김치찌개 김치찜 250g 2개입 8개입 주식회사라이프키친'

| | 6.0 |

'CJ 간편요리 간편식 밀키트 비비고 깻잎고기만두400gx2 전골 라면 술안주 반찬 서화tc'
'CJ 간편요리 간편식 밀키트 비비고 청양고기만두 400gx2 전골 라면 술안주 반찬 서화tc'
'CJ [식물성]비비고 밥반찬 플랜테이블왕교자 385g 즉석 간단 간편요리 나혼산 혼밥 엄마밥 인영'

| | 9.0 |

'삼립 참치마요 스쿱 샐러드 700G 아이스박스포장 에이알비'
'샐러드미인 대용량 에그포테이토 샐러드 토핑 1kg 콘버터 1kg 엠디에스마케팅 주식회사'
'피코크 에그 포테이토 샐러드 500g x 1개 종이박스포장 에이알비'

| | 1.0 |

'국내산 수제 현미누룽지 검정깨누룽지 1봉 주식회사 우리곡간'
'비알푸드 숭늉이 구수한 가마솥 누아미 누룽지 350g 비알푸드 누아미누룽지팝 50gX3봉 드림스토어'
'가화푸드 지평선 현미누룽지 150g x 10개입 김제평야 햅쌀 국내산 현미 가화푸드'

| | 8.0 |

'마라 곤약 마라맛 곤약 매운맛 간식 중국 향라맛 향라2 쑤안라1 라비엔또'
'도토리건조묵 100gx2 바니스타일'
'도토리묵가루 500gx1 바니스타일'

| ## Evaluation ### Metrics | Label | Metric | |:--------|:-------| | **all** | 0.8677 | ## Uses ### Direct Use for Inference First install the SetFit library: ```bash pip install setfit ``` Then you can load this model and run inference. ```python from setfit import SetFitModel # Download from the 🤗 Hub model = SetFitModel.from_pretrained("mini1013/master_cate_fd4") # Run inference preds = model("오뚜기 옛날 쇠고기죽 85g (주) 식자재민족") ``` ## Training Details ### Training Set Metrics | Training set | Min | Median | Max | |:-------------|:----|:-------|:----| | Word count | 3 | 9.5276 | 26 | | Label | Training Sample Count | |:------|:----------------------| | 0.0 | 50 | | 1.0 | 50 | | 2.0 | 50 | | 3.0 | 50 | | 4.0 | 50 | | 5.0 | 50 | | 6.0 | 50 | | 7.0 | 50 | | 8.0 | 50 | | 9.0 | 50 | | 10.0 | 50 | | 11.0 | 50 | | 12.0 | 50 | | 13.0 | 50 | | 14.0 | 50 | | 15.0 | 50 | | 16.0 | 50 | | 17.0 | 50 | | 18.0 | 50 | | 19.0 | 50 | | 20.0 | 50 | ### Training Hyperparameters - batch_size: (512, 512) - num_epochs: (20, 20) - max_steps: -1 - sampling_strategy: oversampling - num_iterations: 40 - body_learning_rate: (2e-05, 2e-05) - head_learning_rate: 2e-05 - loss: CosineSimilarityLoss - distance_metric: cosine_distance - margin: 0.25 - end_to_end: False - use_amp: False - warmup_proportion: 0.1 - seed: 42 - eval_max_steps: -1 - load_best_model_at_end: False ### Training Results | Epoch | Step | Training Loss | Validation Loss | |:-------:|:----:|:-------------:|:---------------:| | 0.0061 | 1 | 0.4265 | - | | 0.3030 | 50 | 0.3323 | - | | 0.6061 | 100 | 0.234 | - | | 0.9091 | 150 | 0.1134 | - | | 1.2121 | 200 | 0.0641 | - | | 1.5152 | 250 | 0.0509 | - | | 1.8182 | 300 | 0.0435 | - | | 2.1212 | 350 | 0.0309 | - | | 2.4242 | 400 | 0.0191 | - | | 2.7273 | 450 | 0.0163 | - | | 3.0303 | 500 | 0.0215 | - | | 3.3333 | 550 | 0.0161 | - | | 3.6364 | 600 | 0.024 | - | | 3.9394 | 650 | 0.006 | - | | 4.2424 | 700 | 0.0116 | - | | 4.5455 | 750 | 0.0061 | - | | 4.8485 | 800 | 0.0025 | - | | 5.1515 | 850 | 0.001 | - | | 5.4545 | 900 | 0.0003 | - | | 5.7576 | 950 | 0.0002 | - | | 6.0606 | 1000 | 0.0002 | - | | 6.3636 | 1050 | 0.0001 | - | | 6.6667 | 1100 | 0.0002 | - | | 6.9697 | 1150 | 0.0002 | - | | 7.2727 | 1200 | 0.0001 | - | | 7.5758 | 1250 | 0.0001 | - | | 7.8788 | 1300 | 0.0001 | - | | 8.1818 | 1350 | 0.0001 | - | | 8.4848 | 1400 | 0.0001 | - | | 8.7879 | 1450 | 0.0001 | - | | 9.0909 | 1500 | 0.0001 | - | | 9.3939 | 1550 | 0.0001 | - | | 9.6970 | 1600 | 0.0001 | - | | 10.0 | 1650 | 0.0001 | - | | 10.3030 | 1700 | 0.0001 | - | | 10.6061 | 1750 | 0.0001 | - | | 10.9091 | 1800 | 0.0001 | - | | 11.2121 | 1850 | 0.0001 | - | | 11.5152 | 1900 | 0.0001 | - | | 11.8182 | 1950 | 0.0001 | - | | 12.1212 | 2000 | 0.0001 | - | | 12.4242 | 2050 | 0.0001 | - | | 12.7273 | 2100 | 0.0001 | - | | 13.0303 | 2150 | 0.0001 | - | | 13.3333 | 2200 | 0.0001 | - | | 13.6364 | 2250 | 0.0001 | - | | 13.9394 | 2300 | 0.0001 | - | | 14.2424 | 2350 | 0.0 | - | | 14.5455 | 2400 | 0.0 | - | | 14.8485 | 2450 | 0.0001 | - | | 15.1515 | 2500 | 0.0 | - | | 15.4545 | 2550 | 0.0001 | - | | 15.7576 | 2600 | 0.0 | - | | 16.0606 | 2650 | 0.0 | - | | 16.3636 | 2700 | 0.0001 | - | | 16.6667 | 2750 | 0.0001 | - | | 16.9697 | 2800 | 0.0001 | - | | 17.2727 | 2850 | 0.0001 | - | | 17.5758 | 2900 | 0.0001 | - | | 17.8788 | 2950 | 0.0001 | - | | 18.1818 | 3000 | 0.0 | - | | 18.4848 | 3050 | 0.0 | - | | 18.7879 | 3100 | 0.0001 | - | | 19.0909 | 3150 | 0.0 | - | | 19.3939 | 3200 | 0.0001 | - | | 19.6970 | 3250 | 0.0 | - | | 20.0 | 3300 | 0.0 | - | ### Framework Versions - Python: 3.10.12 - SetFit: 1.1.0.dev0 - Sentence Transformers: 3.1.1 - Transformers: 4.46.1 - PyTorch: 2.4.0+cu121 - Datasets: 2.20.0 - Tokenizers: 0.20.0 ## Citation ### BibTeX ```bibtex @article{https://doi.org/10.48550/arxiv.2209.11055, doi = {10.48550/ARXIV.2209.11055}, url = {https://arxiv.org/abs/2209.11055}, author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren}, keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences}, title = {Efficient Few-Shot Learning Without Prompts}, publisher = {arXiv}, year = {2022}, copyright = {Creative Commons Attribution 4.0 International} } ```