metadata

base_model: mini1013/master_domain
library_name: setfit
metrics:
  - metric
pipeline_tag: text-classification
tags:
  - setfit
  - sentence-transformers
  - text-classification
  - generated_from_setfit_trainer
widget:
  - text: 1+1 세트상품 푸쉬팝게임기 팝잇 푸시팝 뽁뽁이 게임기 스피드킹 토끼 곰돌이 우주인게임기_병아리게임기(5세대999레벨) 크앤비
  - text: 굵은 모루 8mm 일반 장식줄 만들기재료 철사공예 아트 모루꽃 아트모루(10개입세트)_형광연두 아이디몬 주식회사
  - text: 해리포터코스튬 풀세트 어린이 성인 남녀공용 졸사 이벤트 의상 추억 사진 후플푸프(7세트)_XXL 181-185cm 권장 here_
  - text: 3D 토이나이프 야광 당근칼 틱톡 나이프 피젯 장난감 칼 미니검 3연발 다트권총(핑크) 또와토이
  - text: 알꿀밤 소형 나노블럭 미니블록 5+1 YK앉은 분홍 고양이 243. CK꽃무늬 롱치마 해적 늘솔길에아람벌다
inference: true
model-index:
  - name: SetFit with mini1013/master_domain
    results:
      - task:
          type: text-classification
          name: Text Classification
        dataset:
          name: Unknown
          type: unknown
          split: test
        metrics:
          - type: metric
            value: 0.9032178674706208
            name: Metric

SetFit with mini1013/master_domain

This is a SetFit model that can be used for Text Classification. This SetFit model uses mini1013/master_domain as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

Fine-tuning a Sentence Transformer with contrastive learning.
Training a classification head with features from the fine-tuned Sentence Transformer.

Model Details

Model Description

Model Type: SetFit
Sentence Transformer body: mini1013/master_domain
Classification head: a LogisticRegression instance
Maximum Sequence Length: 512 tokens
Number of Classes: 14 classes

Model Sources

Repository: SetFit on GitHub
Paper: Efficient Few-Shot Learning Without Prompts
Blogpost: SetFit: Efficient Few-Shot Learning Without Prompts

Model Labels

Label	Examples
5.0	'(LMG 택티컬) BFE 파우치 OD 대신장비샵' '퍼프디노 그린가스 블랙 파워가스 600ml 12kg 검펍디 리버티라이프(Liberty Life)' '아카데미과학 전동권총 데저트이글 L6 비비탄권총 자동 에어소프트건 비비탄총 09. 한국군 K5 오마이컴퍼니'
4.0	'DJI 네오 / 납품 세금계산서 가능 주식회사 모즈인터내셔날' 'DJI Air 3 Fly More Combo (DJI RC-N2 포함) 게이트비젼(주)' 'DJI AIR 3S 에어 3S 플라이 모어 콤보 (RC2)납품 세금계산서가능 주식회사 모즈인터내셔날'
10.0	'해적안대 가죽 할로윈용품 파티 의상소품 장식 데코 홈피스트' '특수분장 할로윈 더마왁스상처재료 가짜피 인조피100ml BMmall' '해적안대 가죽 할로윈 용품 파티 의상소품 데이 에스지'
3.0	'디디샵 지우개 야광 당근 나이프 (주)라온러닝' '반다이 정품 RG 가오가이거 선물의 목적' '주사모형 정맥 주입 근육 훈련 팔 모델 간호사 혈액 손 모형 팔뚝 정맥 천자 재킷 싹슬'
12.0	'소량 포스터 출력 인쇄 / 4종류 종이 / A3(420 297) 단면 아트지90g A3(420×297)_양면_스노우지 250g 킹콩카피' '6090포스터 모음 W-3. 지구지도 포스터 한글 - 블루2 주식회사 제로퍼제로' '천 포스터 가리개 장식 행잉 크리스마스 벽 트리 패브릭 인테리어 소품 5. 전나무 130X150 성공한 스토어'
2.0	'비즈아이 [4925-13]글라스통과형 도트트리 15x16mm,1개 투명 비즈아이' '스쿠비두 룰라끈 매듭 공예 키링 스쿠비드 1m 낱줄 운동화끈-빨강 꾀조은' '비즈아이 [4925-13]글라스통과형 도트트리 15x16mm,1개 그린 비즈아이'
1.0	'최고급 메탈 피젯 핑거 스피너 야광 무소음 연속 회전 1_01_오렌지 sf103 사찌몰' '5초 준다 MinSellAmount 스마일배송' '5초 준다 주식회사 보드엠'
8.0	'빈티지 도장 스탬프 헤드 카드 봉투 청첩장 선물 포장 18.1588971 14.1588966 써니타운몰15호점' '킵탑 자동차 유아용 보조 카시트 방석 커버 보호매트 삼촌쇼핑몰' '오렌지오피스 스카이보람 우표 수집 앨범 리필내지 전지 우표 5단 리필 오렌지 오피스'
7.0	'세븐틴 응원봉 SEVENTEEN OFFICIAL LIGHT STICK VER.3 (새제품) 조우코리아' 'IVE 아이브 응원봉 키링 오후세시반' '아이브 얼빡샷 포카 포토카드 옵션선택 배디 키치홀리데이'
11.0	'직소퍼즐 주문제작 커플 여행 기념일 선물 사진 퍼즐액자 제작 A5-(80피스)_추가안함_세로 투미투' '짱구는못말려 소풍 100피스 만화 캐릭터 직소퍼즐 [ 짱구는못말려 150 피스 ]_19.온천욕-150 예그린스페이스' '짱구는못말려 소풍 100피스 만화 캐릭터 직소퍼즐 [ 짱구는못말려 150 피스 ]_03.디비전-150 예그린스페이스'
0.0	'봇치 더 락 록 굿즈 결속 밴드 아날로그 LP 바이닐 한정판 일본 직구 기본 다락방' '2LP 게이트폴드 비닐 컷팅 32cm 10장 2LP 게이트폴드 비닐 컷팅 32cm 10장 포린(porin)' '잭 브라이언 The Great American Bar Scene 바이닐 LP 앨범 음반 엘라커넥티드'
13.0	'전문가 동전 수집 코인 케이스 보관 종이 홀더 50장 코인홀더 종이홀더 수집홀더 37mm 더비씨디' '개업 연말 이벤트 답례 축하 선물 행운의 2달러 포함 액자 행운의2달러 액자 주식회사 투마이니' '비트코인 기념주화 모형 장식 3종 골드 에스에이치에너지'
6.0	'유니콘 입체 그림 인테리어 소품 액자 유니콘 그림 1번지 스토어' '서예용품 단아미 고급서예붓18mm 화방 화방용 화선지 글로벌케이마켓' '16절고무판(20입)문구 교재류 준비물 판화교재 남생몰'
9.0	'파니니 NBA카드 탑클래스 KBL 농구카드 1박스 르브론제임스 스테판커리 이정현 허웅 허훈 월드스포츠카드서울신도림점' '원피스 루피 조로 캐릭터 굿즈 트럼프카드 유캔매직샵' '고전키티 과일키티 스트랩 오타쿠 다락방'

Evaluation

Metrics

Label	Metric
all	0.9032

Uses

Direct Use for Inference

First install the SetFit library:

pip install setfit

Then you can load this model and run inference.

from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("mini1013/master_cate_lh15")
# Run inference
preds = model("3D 토이나이프 야광 당근칼 틱톡 나이프 피젯 장난감 칼 미니검 3연발 다트권총(핑크) 또와토이")

Training Details

Training Set Metrics

Training set	Min	Median	Max
Word count	3	10.9546	25

Label	Training Sample Count
0.0	50
1.0	50
2.0	50
3.0	50
4.0	48
5.0	50
6.0	38
7.0	50
8.0	50
9.0	25
10.0	50
11.0	50
12.0	50
13.0	50

Training Hyperparameters

batch_size: (512, 512)
num_epochs: (20, 20)
max_steps: -1
sampling_strategy: oversampling
num_iterations: 40
body_learning_rate: (2e-05, 2e-05)
head_learning_rate: 2e-05
loss: CosineSimilarityLoss
distance_metric: cosine_distance
margin: 0.25
end_to_end: False
use_amp: False
warmup_proportion: 0.1
seed: 42
eval_max_steps: -1
load_best_model_at_end: False

Training Results

Epoch	Step	Training Loss	Validation Loss
0.0096	1	0.4054	-
0.4808	50	0.3432	-
0.9615	100	0.2163	-
1.4423	150	0.0533	-
1.9231	200	0.0368	-
2.4038	250	0.0235	-
2.8846	300	0.0308	-
3.3654	350	0.0158	-
3.8462	400	0.0122	-
4.3269	450	0.0117	-
4.8077	500	0.0041	-
5.2885	550	0.004	-
5.7692	600	0.006	-
6.25	650	0.0096	-
6.7308	700	0.004	-
7.2115	750	0.0002	-
7.6923	800	0.0002	-
8.1731	850	0.0001	-
8.6538	900	0.0001	-
9.1346	950	0.0001	-
9.6154	1000	0.0001	-
10.0962	1050	0.0001	-
10.5769	1100	0.0001	-
11.0577	1150	0.0001	-
11.5385	1200	0.0	-
12.0192	1250	0.0001	-
12.5	1300	0.0001	-
12.9808	1350	0.0001	-
13.4615	1400	0.0001	-
13.9423	1450	0.0	-
14.4231	1500	0.0	-
14.9038	1550	0.0	-
15.3846	1600	0.0	-
15.8654	1650	0.0	-
16.3462	1700	0.0001	-
16.8269	1750	0.0	-
17.3077	1800	0.0	-
17.7885	1850	0.0	-
18.2692	1900	0.0	-
18.75	1950	0.0	-
19.2308	2000	0.0	-
19.7115	2050	0.0001	-

Framework Versions

Python: 3.10.12
SetFit: 1.1.0.dev0
Sentence Transformers: 3.1.1
Transformers: 4.46.1
PyTorch: 2.4.0+cu121
Datasets: 2.20.0
Tokenizers: 0.20.0

Citation

BibTeX

@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}