metadata

base_model: mini1013/master_domain
library_name: setfit
metrics:
  - metric
pipeline_tag: text-classification
tags:
  - setfit
  - sentence-transformers
  - text-classification
  - generated_from_setfit_trainer
widget:
  - text: 마사지 복 경락 잠옷 피부샵 세트 호텔 아로마 스파 HFG 그레이 남성_XXL 민물유통
  - text: 바스템 리워터 히든커버 필터 샤워기 리워터 히든커버 교체필터 4개입 바스템
  - text: 어메니티타올 환갑 칠순 팔순 구순 회갑 고희 답례품 40수 무형광 주방 고리수건 자수 화이트_동백 어메니티타올
  - text: >-
      [추가 5%할인] 바디럽 비타필터 2개 (녹물염소제거/보습효과/샤워기필터/비타민필터/비타샤워기) [NEW] 민티시트러스 NEW 
      우디오렌지_NEW  퓨어소피 메가글로벌002
  - text: 깔끔디자인 욕실수건걸이 6 pcs 세트 가정용 워시 브러쉬 컵 액체 블랙수건걸이 컵세트 빨간 리마108
inference: true
model-index:
  - name: SetFit with mini1013/master_domain
    results:
      - task:
          type: text-classification
          name: Text Classification
        dataset:
          name: Unknown
          type: unknown
          split: test
        metrics:
          - type: metric
            value: 0.6881059449647262
            name: Metric

SetFit with mini1013/master_domain

This is a SetFit model that can be used for Text Classification. This SetFit model uses mini1013/master_domain as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

Fine-tuning a Sentence Transformer with contrastive learning.
Training a classification head with features from the fine-tuned Sentence Transformer.

Model Details

Model Description

Model Type: SetFit
Sentence Transformer body: mini1013/master_domain
Classification head: a LogisticRegression instance
Maximum Sequence Length: 512 tokens
Number of Classes: 12 classes

Model Sources

Repository: SetFit on GitHub
Paper: Efficient Few-Shot Learning Without Prompts
Blogpost: SetFit: Efficient Few-Shot Learning Without Prompts

Model Labels

Label	Examples
10.0	'홈사우나 전신 스팀 건식 훈증 노폐물배출 2인용 풀세트핑크 다이버릿' 'KBT201S 만성피로 회복 혈액순환 촉진 편백 고급형 건식 반신욕기 미편백 편백 고급형 명성유통상사' '미편백 KBT201S 만성피로 회복 혈액순환 촉진 편백 고급형 건식 반신욕기 원목 고급형 제일유통상사'
8.0	'거울 욕실 수납장 캐비닛 스마트 화장실 선반 방수 저장 벽걸이 115 A형 문라이트 화이트 70CM 일반 거울 마켓에스' '1P 매직 걸이 후크 투명 접착식 무타공 액자 선반 열두번째모닝' '참생활 스텐 기둥식 코너선반 욕조형 3단 욕실선반 화장실선반 스텐 기둥식 일자선반_욕조형 600 3단 형진산업'
1.0	'비데 휴대용 아기 비대 여행용 환자용 휴대용비데 워시케어 메리머치(Merry Merch)' '쿠쿠 인스퓨어 CBT-G1032MW 자가설치 MinSellAmount 꿀디' '노비타 슈퍼슬림비데 BD-H350 (탈취/건조/자동노즐세척) 설치의뢰(현장2만원지급) NS몰'
6.0	'[11월기획]튜브스퀴저 스탠드형 돌돌이 치약짜개 디스펜서_9850CkY_다판다차차 기획 탄산뱅크' '마비스 디스펜서 (스퀴저) (주)시담' '규조토 트레이 S(11.5x7.5cm)_오프화이트 주식회사 이클레틱'
5.0	'단차해소기 높이맞춤 현관 경사판 방문턱 발판 패드 CA 피터스토어' '나무발판 원목 현관 욕실 발판 원목_100 x 30 우드플러스' '심플 발판 욕 실 다용도 풋페달 발 받침대 거치대 KK705 다리불편 디딤대 욕실 발 세척 가드 홉포엘'
9.0	'3M 슬림 베이킹소다 크린스틱 시트타입 디스펜서팩(30매 포함) + 60매 / 욕실청소 화장실청소 스카치브라이트 1. 디스펜서팩(30매 포함) + 리필 60매 1. 디스펜서팩(30매 포함) + 리필 60매 메가글로벌002' '플루브 화장실 줄눈시공 코팅제 셀프 리모델링 변기테두리용_화이트진주펄_45g 플루브엔트' 'co/(10M)막힌 배수구 시원하게 스프링 뚫어뻥 관통기통 스네이크 좋은상품 벤타마켓'
4.0	'1+1 등원 핸드타올 거위 펭귄 타월 핵인싸템 귀염뽀짝 어린이집수건 01_1+1 등원 핸드타올 거위 펭귄 타월_거위 그레이+펭귄 핑크 주식회사 코윈커머스' '태슬원피스 주방타올 (옷걸이포함) 차콜 코지로그' '바캉스 Best 특대형 비치타올 블루라군 180cm x 100cm 케이투나인'
0.0	'질레트 비너스 엑스트라 스무스 면도날 4입 비너스 엑스트라 스무스 면도날 4입 G107 신세계몰' '[추석맞이 15%] 도루코 페이스5스타일 면도날 세트 (12입) / 5중날/호환가능 베이직 스타터킷 면도세트 샵피온' '[쉬크] 이그젝타2 센서티브 휴대용면도기 10개입 신세계몰'
7.0	'손잡이 쌀 세척볼 (3color) 과일 야채 채반 바가지 바스켓 물빠짐 블랙 쭌쭌형제' '바이칸 원형스쿠프 바가지 사료삽 스쿱 100도소독가능 01) 1L_파랑(56813) 유니365' '닥터세닥 미니스 여행용 세트 여성용 리빙어센틱'
11.0	'화이트 심플 모던 욕실 세면대 미니세면대 간이 하부장 다용도실 손빨래 28 70x48 바닥 흰색(도어 포함) - 냉 한빛테크(Hanbit Tech)' '소변기 남자 화장실 세라믹 벽걸이 욕실 공원 양변기 야외 요강 F.와이어드로잉8309소변기+강화유리은폐센서 데이셀' '화이트 심플 모던 욕실 세면대 미니세면대 간이 하부장 다용도실 손빨래 6 51x36 바닥 흰색(문 없음) - 온수 한빛테크(Hanbit Tech)'
3.0	'소변기감지기 자바TU100 자동 소변기 센서 세척밸브 조아스' '싱크대배수구교체 싱크대배수통 배수구세트 JUS 대형 은항균_막힘너트(OF없음) HOMETOOL' '듀벨 수도애 정수키트 리필 필터 10개 2 정수키트용 리필필터 20개 주식회사 듀벨'
2.0	'orb 오브 다용도 바구니 L/ 수납 정리 편리 목욕 장난감 피크닉 다용도 화이트 에이치샵' '먼작귀 아크릴 캔디 스탠드-24EA 네쿠네쿠' '친구결혼선물 로브가운 실크샤무즈 롱 남자/여자 나이트가운 로브_블랙100[XL] 매구맵시'

Evaluation

Metrics

Label	Metric
all	0.6881

Uses

Direct Use for Inference

First install the SetFit library:

pip install setfit

Then you can load this model and run inference.

from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("mini1013/master_cate_lh18")
# Run inference
preds = model("바스템 리워터 히든커버 필터 샤워기 리워터 히든커버 교체필터 4개입 바스템")

Training Details

Training Set Metrics

Training set	Min	Median	Max
Word count	3	10.42	26

Label	Training Sample Count
0.0	50
1.0	50
2.0	50
3.0	50
4.0	50
5.0	50
6.0	50
7.0	50
8.0	50
9.0	50
10.0	50
11.0	50

Training Hyperparameters

batch_size: (512, 512)
num_epochs: (20, 20)
max_steps: -1
sampling_strategy: oversampling
num_iterations: 40
body_learning_rate: (2e-05, 2e-05)
head_learning_rate: 2e-05
loss: CosineSimilarityLoss
distance_metric: cosine_distance
margin: 0.25
end_to_end: False
use_amp: False
warmup_proportion: 0.1
seed: 42
eval_max_steps: -1
load_best_model_at_end: False

Training Results

Epoch	Step	Training Loss	Validation Loss
0.0106	1	0.4109	-
0.5319	50	0.305	-
1.0638	100	0.2044	-
1.5957	150	0.0728	-
2.1277	200	0.0314	-
2.6596	250	0.0054	-
3.1915	300	0.0036	-
3.7234	350	0.0103	-
4.2553	400	0.0047	-
4.7872	450	0.0002	-
5.3191	500	0.0001	-
5.8511	550	0.0001	-
6.3830	600	0.0001	-
6.9149	650	0.0001	-
7.4468	700	0.0001	-
7.9787	750	0.0001	-
8.5106	800	0.0001	-
9.0426	850	0.0	-
9.5745	900	0.0001	-
10.1064	950	0.0001	-
10.6383	1000	0.0	-
11.1702	1050	0.0	-
11.7021	1100	0.0	-
12.2340	1150	0.0	-
12.7660	1200	0.0001	-
13.2979	1250	0.0	-
13.8298	1300	0.0	-
14.3617	1350	0.0	-
14.8936	1400	0.0001	-
15.4255	1450	0.0	-
15.9574	1500	0.0	-
16.4894	1550	0.0	-
17.0213	1600	0.0	-
17.5532	1650	0.0	-
18.0851	1700	0.0001	-
18.6170	1750	0.0	-
19.1489	1800	0.0	-
19.6809	1850	0.0	-

Framework Versions

Python: 3.10.12
SetFit: 1.1.0.dev0
Sentence Transformers: 3.1.1
Transformers: 4.46.1
PyTorch: 2.4.0+cu121
Datasets: 2.20.0
Tokenizers: 0.20.0

Citation

BibTeX

@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}