Edit model card

SetFit with mini1013/master_domain

This is a SetFit model that can be used for Text Classification. This SetFit model uses mini1013/master_domain as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

  1. Fine-tuning a Sentence Transformer with contrastive learning.
  2. Training a classification head with features from the fine-tuned Sentence Transformer.

Model Details

Model Description

Model Sources

Model Labels

Label Examples
15.0
  • '청정원 카레여왕 망고바나나 108g 4_청정원 치즈코코넛 108g 고래인터내셔널'
  • '청정원 카레여왕 망고 앤 바나나 108g 주식회사 에이치제이인터내셔널'
  • '0212. 카레분말(매운맛) - 오뚜기1kg 베이킹도전'
5.0
  • 'M&F 몬 월남쌈 사각 200g 16cm 라이스페이퍼 얌얌몰'
  • '몬 뉴 월남쌈 300g 원형 라이스페이퍼 16cm 베트남 월남쌈 재료 몬 현미 월남쌈(원형) 200g (주) 바른들식품농업회사법인'
  • '몬 월남쌈 원형 라이스페이퍼 200g 1개 coupang'
7.0
  • '동원 더킹 크랩스 랍스터맛 오리지널 140g 6개 맛살 샐러드 초밥 스시 김밥용 2.더킹 크랩스 랍스터맛 140g x 6개 (주)에이알커머스'
  • '한성 저지방 크래미 180g x 2개입 (주)씨티케이이비전코리아'
  • '한성기업 해조칼슘 크래미F 1kg 제루통상'
10.0
  • '폰타나 스위트콘 크림 수프 180g 03.그릴드 머쉬룸크림 수프180g-SPPSF 주식회사 삼공오공'
  • '오뚜기 양송이 스프 1kg 모아유통'
  • '오뚜기 양송이스프 80g(분말) 간편식 가루스프 즉석스프 외 4종 오뚜기 크림스프 80g(분말) 마켓위너'
3.0
  • '동원 냉동 해물모듬완자 1kg 제이에이치'
  • '(맛나)잡채해물완자 1KG/(주)사조오양 두드림'
  • '삼양 모닝하임 동그랑땡 1kg 업소용 대용량 반찬 동그랑땡 금성식품 주식회사'
0.0
  • '한성 프리미엄 김밥재료세트 440g(5인분10줄) 포안'
  • '냉동 혼합야채 4종 1kg 볶음밥용 야채믹스 농우 냉동 옥수수알 1kg 주식회사 팜'
  • '한채원 껍질없는 구운감자 리얼미니 한입 통 감자 150g 리얼미니 구운감자 1팩 농업회사법인 한채원 주식회사'
16.0
  • '동원 퀴진 더블치즈스틱 400g x 1개 아이스보냉백포장 오하'
  • '애슐리 스윗 콤보 치킨 (냉동) 460g 1개 엠에스 컨설팅'
  • '코코스 냉동 닭껍질 튀김 (1kg) 치킨 에어프라이어 (드라이아이스 포장) 05.(유통기한 24.06.22)버팔로봉1kg 잇츠컴퍼니'
4.0
  • 'cj 초간단 즐거운동행 미정당 쫄볶이 470g 혼밥 술안주 자취 탕비실 간식 야식 두칭구'
  • '미미네 국물떡볶이 9봉 + 눈꽃치즈 국물떡볶이 1봉 (총10봉) 브라이트컴퍼니'
  • '미미네 오리지널 국물떡볶이 6봉 오리지널 국물떡볶이/눈꽃치즈 국물떡볶이 각3봉 마일드스토어'
20.0
  • '만복당 대만 샌드위치 햄치즈(냉동) 8개세트 치즈 8입 (주)한국푸드본'
  • '한맥식품 직화그릴 더블버거 210g 5개 학생 간식 한맥식품 직화그릴 더블버거 210g 5개 현명한쇼핑'
  • '만복당 대만 샌드위치 햄치즈(냉동) 18개X5세트 = 총90개/개당1,650원 햄(18입X5세트) (주)한국푸드본'
11.0
  • '어묵장인 박경도의 어묵탕 x10봉 바이투'
  • '영자어묵 오리지널 사각 꼬치 캠핑 부산 어묵 오뎅 오뎅탕 밀키트 350g(10개입) 주식회사 금진식품'
  • '삼호 부산 어묵 어묵채 1kg 잡채 김밥 볶음용 CJ씨푸드 삼호부산어묵 어묵채 1kg 주식회사 팜'
17.0
  • '피자씨티 페스츄리도우 8인치(125g) 25매팩 2박스 피자씨티'
  • '한성 롤스틱 치즈 80g 주식회사 명일푸드'
  • '파파스 씬도우 10인치 15장 씬피자도우 4종 11인치(11월초입고예정) D.S글로벌비즈'
18.0
  • '아워홈 버거 헌터 함박 스테이크 2인분 400g (주)아워홈'
  • '삼양새아침 더블 함박스테이크 1kg 유한회사 365푸드'
  • '고기대신 식물성 베지 바베큐맛 미트볼 300g 주식회사 알티스트'
2.0
  • '하림이닭 다이어트 탄단지 도시락 김치볶음밥과 비엔나소시지 210g 5팩 외 7종 귀리밥과 가라아게 210g 5팩 주식회사 하림'
  • '허닭 다이어트 냉동 도시락 210g 4종 4팩 다이어트 도시락 베이컨잡곡 4팩 주식회사 허닭'
  • '아워홈 온더고 소고기 오색비빔밥 310g 아워홈 온더고 로제파스타 미니함박290g 주식회사 은하'
19.0
  • '고메 통모짜 크리스피 핫도그 340g 3개 총 12입 라이프스마트'
  • 'Chefood 우유핫도그 70gx20개 우유핫도그 70gx10개 우유핫도그 70gx10개_우유핫도그 70gx10개 용진건재'
  • '하림 스위트 핫도그 1kg 닭가슴살핫도그 450g 성원종합유통'
14.0
  • '비비고 김치치즈 주먹밥 500Gx3개 미루시스템'
  • '네이처엠 현미밥 150g X 24개 미동의 제이엠세일즈'
  • '384369 오뚜기 맛있는 오뚜기밥 200g 3개 /즉석밥/컵밥/햇반/간편밥/휴대용 오뚜기 진비빔면 159g 4개 (1봉지) /멀 제이엠무역'
12.0
  • '[2+1 골라담기] 동원 양반 전복죽 420g 총 3개 외 9종 [2+1] 양반 참치죽 420g 총3개 (주)에이알커머스'
  • '동원 양반죽 쇠고기죽 파우치 외3종 양반볶음김치 비에이'
  • '동원 양반죽 참치 285g 동원양반죽_참치 대제종합물류센터'
13.0
  • '장사의신 내장탕 750g 장사의 신 컴퍼니'
  • '소문난 비비고 돼지고기김치찌개 460g CJ제일제당 간편식 요리레시피 감칠맛업 홈파티음식 캠핑요리 집밥 에스더블유디자인'
  • '명장 김치찌개 김치찜 250g 2개입 8개입 주식회사라이프키친'
6.0
  • 'CJ 간편요리 간편식 밀키트 비비고 깻잎고기만두400gx2 전골 라면 술안주 반찬 서화tc'
  • 'CJ 간편요리 간편식 밀키트 비비고 청양고기만두 400gx2 전골 라면 술안주 반찬 서화tc'
  • 'CJ [식물성]비비고 밥반찬 플랜테이블왕교자 385g 즉석 간단 간편요리 나혼산 혼밥 엄마밥 인영'
9.0
  • '삼립 참치마요 스쿱 샐러드 700G 아이스박스포장 에이알비'
  • '샐러드미인 대용량 에그포테이토 샐러드 토핑 1kg 콘버터 1kg 엠디에스마케팅 주식회사'
  • '피코크 에그 포테이토 샐러드 500g x 1개 종이박스포장 에이알비'
1.0
  • '국내산 수제 현미누룽지 검정깨누룽지 1봉 주식회사 우리곡간'
  • '비알푸드 숭늉이 구수한 가마솥 누아미 누룽지 350g 비알푸드 누아미누룽지팝 50gX3봉 드림스토어'
  • '가화푸드 지평선 현미누룽지 150g x 10개입 김제평야 햅쌀 국내산 현미 가화푸드'
8.0
  • '마라 곤약 마라맛 곤약 매운맛 간식 중국 향라맛 향라2 쑤안라1 라비엔또'
  • '도토리건조묵 100gx2 바니스타일'
  • '도토리묵가루 500gx1 바니스타일'

Evaluation

Metrics

Label Metric
all 0.8677

Uses

Direct Use for Inference

First install the SetFit library:

pip install setfit

Then you can load this model and run inference.

from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("mini1013/master_cate_fd4")
# Run inference
preds = model("오뚜기 옛날 쇠고기죽 85g  (주) 식자재민족")

Training Details

Training Set Metrics

Training set Min Median Max
Word count 3 9.5276 26
Label Training Sample Count
0.0 50
1.0 50
2.0 50
3.0 50
4.0 50
5.0 50
6.0 50
7.0 50
8.0 50
9.0 50
10.0 50
11.0 50
12.0 50
13.0 50
14.0 50
15.0 50
16.0 50
17.0 50
18.0 50
19.0 50
20.0 50

Training Hyperparameters

  • batch_size: (512, 512)
  • num_epochs: (20, 20)
  • max_steps: -1
  • sampling_strategy: oversampling
  • num_iterations: 40
  • body_learning_rate: (2e-05, 2e-05)
  • head_learning_rate: 2e-05
  • loss: CosineSimilarityLoss
  • distance_metric: cosine_distance
  • margin: 0.25
  • end_to_end: False
  • use_amp: False
  • warmup_proportion: 0.1
  • seed: 42
  • eval_max_steps: -1
  • load_best_model_at_end: False

Training Results

Epoch Step Training Loss Validation Loss
0.0061 1 0.4265 -
0.3030 50 0.3323 -
0.6061 100 0.234 -
0.9091 150 0.1134 -
1.2121 200 0.0641 -
1.5152 250 0.0509 -
1.8182 300 0.0435 -
2.1212 350 0.0309 -
2.4242 400 0.0191 -
2.7273 450 0.0163 -
3.0303 500 0.0215 -
3.3333 550 0.0161 -
3.6364 600 0.024 -
3.9394 650 0.006 -
4.2424 700 0.0116 -
4.5455 750 0.0061 -
4.8485 800 0.0025 -
5.1515 850 0.001 -
5.4545 900 0.0003 -
5.7576 950 0.0002 -
6.0606 1000 0.0002 -
6.3636 1050 0.0001 -
6.6667 1100 0.0002 -
6.9697 1150 0.0002 -
7.2727 1200 0.0001 -
7.5758 1250 0.0001 -
7.8788 1300 0.0001 -
8.1818 1350 0.0001 -
8.4848 1400 0.0001 -
8.7879 1450 0.0001 -
9.0909 1500 0.0001 -
9.3939 1550 0.0001 -
9.6970 1600 0.0001 -
10.0 1650 0.0001 -
10.3030 1700 0.0001 -
10.6061 1750 0.0001 -
10.9091 1800 0.0001 -
11.2121 1850 0.0001 -
11.5152 1900 0.0001 -
11.8182 1950 0.0001 -
12.1212 2000 0.0001 -
12.4242 2050 0.0001 -
12.7273 2100 0.0001 -
13.0303 2150 0.0001 -
13.3333 2200 0.0001 -
13.6364 2250 0.0001 -
13.9394 2300 0.0001 -
14.2424 2350 0.0 -
14.5455 2400 0.0 -
14.8485 2450 0.0001 -
15.1515 2500 0.0 -
15.4545 2550 0.0001 -
15.7576 2600 0.0 -
16.0606 2650 0.0 -
16.3636 2700 0.0001 -
16.6667 2750 0.0001 -
16.9697 2800 0.0001 -
17.2727 2850 0.0001 -
17.5758 2900 0.0001 -
17.8788 2950 0.0001 -
18.1818 3000 0.0 -
18.4848 3050 0.0 -
18.7879 3100 0.0001 -
19.0909 3150 0.0 -
19.3939 3200 0.0001 -
19.6970 3250 0.0 -
20.0 3300 0.0 -

Framework Versions

  • Python: 3.10.12
  • SetFit: 1.1.0.dev0
  • Sentence Transformers: 3.1.1
  • Transformers: 4.46.1
  • PyTorch: 2.4.0+cu121
  • Datasets: 2.20.0
  • Tokenizers: 0.20.0

Citation

BibTeX

@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}
Downloads last month
1,081
Safetensors
Model size
111M params
Tensor type
F32
·
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.

Model tree for mini1013/master_cate_fd4

Base model

klue/roberta-base
Finetuned
(92)
this model

Evaluation results