metadata

base_model: mini1013/master_domain
library_name: setfit
metrics:
  - metric
pipeline_tag: text-classification
tags:
  - setfit
  - sentence-transformers
  - text-classification
  - generated_from_setfit_trainer
widget:
  - text: >-
      전기 스팀해빙기 수도 배관 동파방지 고온 공구 스팀 고성능 고압 2500W 디지털 7점 세트 2500W 산업용 온도조절 7종
      세트+수납함 하니빌리지
  - text: 스텐 나사못 목재 피스 목공 철판 나사 직결 와샤머리 4-13(25개) 11. 스텐 트라스머리 볼트_M5-40 (5개) 리더화스너
  - text: >-
      안전봉투 택배 포장 뽁뽁이 0호 100X100+40 10매 소량 주황 [비접착] 투명 에어캡 봉투 - 0.2T_18호 250x350
      10매 주식회사 이고다(IGODA CO. ,Ltd.)
  - text: 토네이도 다이아몬드 융착코어비트 폴리싱 대리석 천공 TQ5 57_TTC 17 주식회사 투엑스
  - text: 킹토니 핸드소켓 복스알 233504M 2. 롱핸드소켓(육각)_2-21 323513M 3/8x13mm 제로나인
inference: true
model-index:
  - name: SetFit with mini1013/master_domain
    results:
      - task:
          type: text-classification
          name: Text Classification
        dataset:
          name: Unknown
          type: unknown
          split: test
        metrics:
          - type: metric
            value: 0.6113686482182797
            name: Metric

SetFit with mini1013/master_domain

This is a SetFit model that can be used for Text Classification. This SetFit model uses mini1013/master_domain as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

Fine-tuning a Sentence Transformer with contrastive learning.
Training a classification head with features from the fine-tuned Sentence Transformer.

Model Details

Model Description

Model Type: SetFit
Sentence Transformer body: mini1013/master_domain
Classification head: a LogisticRegression instance
Maximum Sequence Length: 512 tokens
Number of Classes: 19 classes

Model Sources

Repository: SetFit on GitHub
Paper: Efficient Few-Shot Learning Without Prompts
Blogpost: SetFit: Efficient Few-Shot Learning Without Prompts

Model Labels

Label	Examples
1.0	'장인들의도구들 오토피드 동관커터기 4분의1 (빨강) 엘디에스컴퍼니(LDS Company)' '농막 물탱크 대용량 플라스틱 우수 물저장 배럴 탱크 25kg (내부 커버 포함) 미들페이지' '인서트 비트 세트, 9개 에스엠샵'
18.0	'[다이소박스] 오픈형 이사박스 단프라 이삿짐 플라스틱 이사용 15. (고급형) 중형박스_(고급형) 중형 청색 주식회사 아성솔루션' 'PE 롤비닐 통비닐 0.03mm 12cm x 457m 0.1mm_선택29. (폭100cm x 길이91m) 주식회사 제일재단' '통샵 공단보자기 45cm 10장묶음 65×65 -10장 묶음_연노랑 통샵'
5.0	'마끼다 충전직소 DJV184Z 본체 18V 속도조절 브러쉬리스 충전직쏘 디유니마켓' '[UDT] 에어 해머 함마 치즐4개 포함 UD-1042 선택3. 에어해머 (UD-1043) 주식회사 마이크로엠알오' '탈포기 기포제거 레진 공예 실리콘 몰드 진공 화장품 19L 지름30Cm 높이 30Cm 토마톡'
4.0	'침대 난간 어르신 환자 기상 보조 프레임 A. 탄소강 좁은 팔걸이 시엘로' '청소중 주차금지 입간판 A형표지판 공사중 미끄럼주의 주차금지 사위탁' '오토스 고글 투명 보안경 618A 넓은 시야확보 긁힘방지 무게 48.4g 가벼운 보호안경 OTOS 보안경 B-618ASF 지엠트리 (GMTree)'
14.0	'평 와셔 스텐 M6 1개 낱개 판매 제이원커머스' '플랜지 후렌지 스텐 후렌치너트 m3 (10개) 5/16인치 (5개) 일진금속' '포니 스프링클램프 집게 핸디 요르젠센 조명고정 3201-HT 베세이 XM3 주식회사 종원툴링'
8.0	'프로펠 미니윈치 단상 220V 호박 와이어윈치 PW160 2홀_160kg_PW160 주식회사 다보인터내셔널(DAVOInternational Co.,Ltd.)' '디월트 잭 리프트 DWHT83550 만능 지랫대 옮기기 냉장고 가구 소형 핸드 01.디월트잭리프트(실재고X 입고시 출고) 주식회사 동성툴 (dongsungtool)' '사다리 접이식 가정용 5단 a형 안전 광폭 작업발판 노랑 NLS05 경량사다리_NLL02 2단 공구 제트(Z)'
0.0	'3M 스폰지 페파 7136270 02601(600~800방) (주)한메소프트' '장판 홈파기 수동 칼 나이프 컷터 커팅기 PVC 바닥 단일 상품 나인포리세븐' '스마토 롱라쳇렌치 한쪽롱 L 13x17L 스마토 롱라쳇렌치 (한쪽롱)L 13x17L 디와이스토어'
6.0	'그린웍스 무선 전정기 40V GMAX 본체 01. 본체 네이스' 'D&D PowerDrive BP78 V 벨트 134247 트리니티 에덴 로우' '혼다 4행정 예초기 셀러리픽 배낭 행정 벌초기 제초기 세트 배낭형 2 GX35 백팩 18.8KW 대행몰A'
12.0	'디월트 충전원형톱 DCS573N 184mm (18V/20V) 본체만 디월트 충전원형톱 DCS573N 184mm ( 최저가유통몰' '디월트 DCG405P2 20V 브러쉬리스 충전 그라인더 (5.0Ahx2) 풀세트 주식회사 부일툴릭스' '충전직소 DJV184Z 본체 18V 속도조절 브러쉬리스 충전직쏘 마끼다 리씨유통'
11.0	'주피터 쥬피터 무선 송풍기 낙엽청소기 JUB-18DE 에어 충전식 18V 디월트 배터리호환 이에스툴' '타이탄드릴맨 스키비디토일렛 업타티맨 업그레이드 스피커맨 활동타이탄클락킹황금대검-536입자 아이엠117' '핫드릴 보석 큐빅 붙이는 펜 방법 건 옷 다림질 포인트 수리 철 헤드 패션 원단 꾸미기 06 핑크 원형헤드 7개인두헤드 없음 삼각 공주&파티'
2.0	'보일러 온수 순환 펌프 모터 윌로 엘지 PH 045M 니더스몰' '영주태양광 3k주택용 지와이(GY)산업' '워터펌프 물펌프 다이아프램 소형 미니 수중 고열 고온 DC 12V 30W 04 워터펌프(고급형-너트) 80W 12V 주식회사 세인티에프'
15.0	'휴대용 수동 카운터기 인원체크 운동량 체크 계수기 강성녕' '티피링크 TP-LINK Tapo T315 스마트 온습도 센서 디스플레이형 Wi-Fi 허브 이 아이티 커머스' '휴대용 디지털 음주측정기 오영이네'
16.0	'노루페인트 슈퍼에나멜 플러스 1L 목재용 철재용 에나멜 유성 페인트 적갈색 유광 특녹색_유광(Gloss) 세계상사' 'pieke 실내 인테리어용 프리미엄 수성 페인트 피크 페인트(1kg) abyss green (주)해광' '[몬타나] 몬타나 골드 그래비티 대용량 다용도 도색용 아크릴 캔스프레이 400ml GOLD 5110_HIMALAYA 대림데칼스토어'
3.0	'무선 인슐린냉장고 휴대 충전 소형 차량 약품 보관함 단일 배터리(대기시간 약 10시간) 유어스토어' '지넥스 정밀드라이버 세트 Y자 별나사 육각 Y 시계 안경 삼각 자석 십자 24in1 아이폰 전용수리공구 001339 주식회사 원빈다이어리' '디월트 프리미엄 수공구세트 184PCS 코스트코 소켓 라쳇 공구세트 108PCS 시크릿카트'
7.0	'고온 고압 스팀 세척기 세차기 청소기 소독 에어컨 2600W 홈 업그레이드 직접 분사 모델 검정 구루미컴퍼니' '크레토스 산소게이지 가스레귤레이터 감압기 조정기 EX-701 LPG-EX-705 알통공구' '크레토스 산소게이지 가스레귤레이터 감압기 조정기 EX-701 CO2-EX-702B 220V-22 알통공구'
17.0	'페인트붓 건축도장기능사준비물 납작붓15mm 막붓 빽붓 문자 도형 평붓 유성수성 미술붓 페인트 붓 폭70mm(11호) 비케이(B.K)코리아' '인터그레인 울트라데크 팀버스테인 10L 리치 초콜렛 (주)나무와사람들 던에드워드 페인트' '수성 금속 방청페인트 속건형 친환경 무취 스테인리스/알루미늄합금 컬러 블루x2_350g 주식회사 플레이산'
9.0	'백마 양손가위 A-3000(180mm) 동아상사' '토종벌 박스 꿀수확 벌꿀 야생벌통 밀랍판 채집 5단 건조 5단 격자 상자 1창 왁스 5단 격자 상자 5창 감동산글로벌' '파종기 모종 다기능 심기 시금치 기계 종자 심는 무 양배추 파종 6줄(줄간격 7.5~9) 셀러리픽몰'
10.0	'진흥 주택용 가정용 누전 차단기 30A 소형 차단기교체 주택용(가정용) 누전차단기_01)2P 30A 소형 그린전기조명' '국산 필수전공 요비선 1선 빨강 5m 낚시대요비선_6.0MM_10EA/SET 피에스툴즈' '캠핑 릴선 15m 4구 밀리터리 캠핑 오토캠핑 니드선 전기선 연장선 2구_카키_15m 롱캠'
13.0	'다우실 707 바이오 방수 실리콘 투명 박스 25개입 주방 싱크대 욕실 욕조 코킹 방화용_다우 1199S 흑색 모멘트리 (MOMENTREE)' '벡스 WD-40 낱개 360ml 신형 스마트 스트로우 SS형 WD40 벡스 WD-40 360ml(일반형) 모멘트리 (MOMENTREE)' '철물팩토리 백색 줄눈 백시멘트 욕실 화장실 변기 보수 메지 크랙 접착제 D형 고무헤라 선진하드웨어'

Evaluation

Metrics

Label	Metric
all	0.6114

Uses

Direct Use for Inference

First install the SetFit library:

pip install setfit

Then you can load this model and run inference.

from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("mini1013/master_cate_lh2")
# Run inference
preds = model("토네이도 다이아몬드 융착코어비트 폴리싱 대리석 천공 TQ5 57_TTC 17 주식회사 투엑스")

Training Details

Training Set Metrics

Training set	Min	Median	Max
Word count	3	10.7474	27

Label	Training Sample Count
0.0	50
1.0	50
2.0	50
3.0	50
4.0	50
5.0	50
6.0	50
7.0	50
8.0	50
9.0	50
10.0	50
11.0	50
12.0	50
13.0	50
14.0	50
15.0	50
16.0	50
17.0	50
18.0	50

Training Hyperparameters

batch_size: (512, 512)
num_epochs: (20, 20)
max_steps: -1
sampling_strategy: oversampling
num_iterations: 40
body_learning_rate: (2e-05, 2e-05)
head_learning_rate: 2e-05
loss: CosineSimilarityLoss
distance_metric: cosine_distance
margin: 0.25
end_to_end: False
use_amp: False
warmup_proportion: 0.1
seed: 42
eval_max_steps: -1
load_best_model_at_end: False

Training Results

Epoch	Step	Training Loss	Validation Loss
0.0067	1	0.3954	-
0.3356	50	0.3839	-
0.6711	100	0.2913	-
1.0067	150	0.2101	-
1.3423	200	0.1066	-
1.6779	250	0.0475	-
2.0134	300	0.0342	-
2.3490	350	0.0274	-
2.6846	400	0.028	-
3.0201	450	0.029	-
3.3557	500	0.0291	-
3.6913	550	0.0258	-
4.0268	600	0.0202	-
4.3624	650	0.0085	-
4.6980	700	0.0124	-
5.0336	750	0.0039	-
5.3691	800	0.0089	-
5.7047	850	0.0063	-
6.0403	900	0.0034	-
6.3758	950	0.0046	-
6.7114	1000	0.008	-
7.0470	1050	0.0048	-
7.3826	1100	0.0028	-
7.7181	1150	0.0042	-
8.0537	1200	0.0019	-
8.3893	1250	0.0008	-
8.7248	1300	0.0004	-
9.0604	1350	0.0003	-
9.3960	1400	0.0003	-
9.7315	1450	0.0002	-
10.0671	1500	0.0003	-
10.4027	1550	0.0002	-
10.7383	1600	0.0001	-
11.0738	1650	0.0002	-
11.4094	1700	0.0001	-
11.7450	1750	0.0001	-
12.0805	1800	0.0001	-
12.4161	1850	0.0001	-
12.7517	1900	0.0001	-
13.0872	1950	0.0001	-
13.4228	2000	0.0001	-
13.7584	2050	0.0001	-
14.0940	2100	0.0001	-
14.4295	2150	0.0001	-
14.7651	2200	0.0001	-
15.1007	2250	0.0001	-
15.4362	2300	0.0001	-
15.7718	2350	0.0001	-
16.1074	2400	0.0001	-
16.4430	2450	0.0001	-
16.7785	2500	0.0001	-
17.1141	2550	0.0001	-
17.4497	2600	0.0001	-
17.7852	2650	0.0001	-
18.1208	2700	0.0001	-
18.4564	2750	0.0001	-
18.7919	2800	0.0001	-
19.1275	2850	0.0001	-
19.4631	2900	0.0001	-
19.7987	2950	0.0001	-

Framework Versions

Python: 3.10.12
SetFit: 1.1.0.dev0
Sentence Transformers: 3.1.1
Transformers: 4.46.1
PyTorch: 2.4.0+cu121
Datasets: 2.20.0
Tokenizers: 0.20.0

Citation

BibTeX

@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}