SetFit with sentence-transformers/all-mpnet-base-v2

This is a SetFit model that can be used for Text Classification. This SetFit model uses sentence-transformers/all-mpnet-base-v2 as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

Fine-tuning a Sentence Transformer with contrastive learning.
Training a classification head with features from the fine-tuned Sentence Transformer.

Model Details

Model Description

Model Type: SetFit
Sentence Transformer body: sentence-transformers/all-mpnet-base-v2
Classification head: a LogisticRegression instance
Maximum Sequence Length: 384 tokens
Number of Classes: 11 classes

Model Sources

Repository: SetFit on GitHub
Paper: Efficient Few-Shot Learning Without Prompts
Blogpost: SetFit: Efficient Few-Shot Learning Without Prompts

Model Labels

Label	Examples
theater	'Cuarentona del amor El amor es una magia, una simple fantasía, es como un sueño… QUE AÚN NO ENCONTREEEEE' '"UN CONCIERTO ENTRE CUERDAS” Sumérgete en el fascinante mundo de Mozart, Mendelssohn, Servais y Shostakovich mientras las cuerdas de la OFL nos revelan sus secretos ocultos. Deja que la música te envuelva y experimenta una noche inolvidable cargada de emociones y suspenso ¡No te pierdas esta oportunidad! Reserva tu lugar y descubre los enigmas musicales en "Un concierto entre cuerdas”.' 'Avenida Q - El Musical "Avenida Q" es un musical protagonizado por títeres y humanos al mejor estilo de los "Muppets" o "Plaza Sésamo". En este exitoso musical de Broadway, Princeton, un recién graduado de la universidad llega a la "Avenida Q", un barrio pobre pero dentro de su presupuesto, para tratar de encontrar la meta en su vida. Ahí conocerá a sus nuevos vecinos. Kate Monstruo, una tierna maestra auxiliar de jardín de infantes, Trekkie Monstruo un adicto al porno, Nicky, un vago, Rod, un banquero que oculta un gran secreto, Brian, un comediante desempleado, Tucurito su prometida y psicóloga y Gary Coleman, una ex estrella de la televisión. \r\nEste musical ácido e irónico toca con mucho humor temas como el racismo, la pornografía, las adicciones, la homosexualidad y la política. \r\nNo recomendable para menores de 14 años'
party	'Baby on Top Baby on Top en Azotea Doce' 'Dani R Chill House Aqp Present. Desde Argentina al Dj/producer Dani R, este sabado 10 de febrero nos vemos desde las 9:00 pm para bailar junto a un gran line up recargado, nos vemos en la avenida parra 207- cercado Informes +51944290978' 'Domingos de Rumba y Sabor Disfruta con nosotros el cierre del fin de semana con la animación de Víctor Ramos - Vicshow y las mezclas en vivo de Dj Tiago. Recuerda que mostrando el QR tienes ingreso hasta las 11:30 pm. No olvides acercarte a la barra para pedir trago de cortesía.'
rock & pop	"GUNS N´ ROSES VS RATA BLANCA, tributo. Un verdadero MANO A MANO, en vivo, una canción interpretada por cada banda, dos backline en escenario: Rata Blanca vs Gun´s Roses \r\n\r\nAsí es, lo que muchos nos pedían, un mano a mano muy esperado, donde las bandas se turnarán para interpretar una canción cada uno y ustedes juzgarán quién fue la mejor de la noche. \r\n\r\nInterpretando a Rata Blanca llegan Vena rock junto a Javo Moscoso. Lo mejor de Guns n´ Roses llegará a cargo de Liestrain - Tributo Guns n' Roses Perú. Además, todo esto con el mejor sonido y luces del Centro de Lima, y GRATIS para las primeras 200 personas en descargar sus pases. ¡Avísale a tus patas!\r\n\r\nViernes 07 Abril - 9:00 pm\r\nYield Rock, Jr. Carabaya 815 Plaza San Martín\r\n Descarga tu pase en #Joinnus hasta el 06 de abril\r\nMismo día en puerta: S/. 20\r\n\r\n#YieldRock #GunsNRoses #RataBlanca"
carlos manucci	'Carlos A. Mannucci vs Club Alianza Lima Venta de entradas: C.A. Mannucci vs Club Alianza Lima por el Torneo Clausura 2022 - Liga 1 Betsson.¡Porque esta la ganamos juntos!'
atletico grau	'Atlético Grau Vs UTC ¡Siempre con el Patrimonio de Piura! \r\n\r\nTodo Piura se une para apoyar a nuestros albos, que necesitan una victoria para escalar en la tabla de posiciones.\r\n\r\nEs ahora que nuestro aliento debe escucharse más que nunca para que nuestro equipo salga a flote.\r\n\r\n¡Vamos Grau, hoy y siempre! '
alianza lima	'ALIANZA LIMA VS CERRO PORTEÑO
art-culture	'Nutella Party Nutella, la crema italiana de cacao y avellana más famosa del mundo, elaborada por la empresa Ferrero, cumple un aniversario más deleitando a niños y adultos. ¡Ven a degustarla en diversas formas y celebremos juntos su creación!'
food-drinks	'Gochiso Perú 2023 Gochiso Perú 2023'
metal	'DISCHARGE en Lima Discharge, la mítica banda hardcore punk Se presentarán por primera vez en Peru este martes 13 de diciembre en Yield Rock, celebrando los 40 años de su álbum más influyente “Hear Nothing, See Nothing, Say Nothing” (1982).'
kids	'LA CENICIENTA Divertido musical, Cenicienta era una bella joven que vivia con su cruel Madrastra y sus hermanastras \r\nel rey invita a todas las jovenes casaderas a un baile en palacio en donde el principe escogera entre ellas a su futura esposa\r\na Cenicienta no la dejan ir pero aparece su hada madrina y con magia ella ira al baile con un hermoso vestido El principe al verla se enamora de ella luego pasara una serie de situaciones muy jocosas hasta encontrar a la dueña del zapato \r\nHay mucha interacion con los niños participando en el baile'
cinema	'AUTOERÓTICA (PRESENCIAL) Bruna es una adolescente que está explorando su sexualidad. Mediante un programa de citas por internet, empieza una relación que sobrepasará su espíritu adolescente y le hará confrontar la libertad de su cuerpo; ayudándola a reconectarse con su verdadera identidad.'

Evaluation

Metrics

Label	Accuracy
all	0.375

Uses

Direct Use for Inference

First install the SetFit library:

pip install setfit

Then you can load this model and run inference.

from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("DiegoGCh/setfit-tryv1")
# Run inference
preds = model("Tono 80 90 la máquina del tiempo Fiesta 80 90 con los videos de la época, artistas invitados Leslie Stewart, Renato Rossini una noche de motos en el escenario rock & roll wave y más!!! .....Que empiece la juerga, anfitrión Renato Rossini.")

Training Details

Training Set Metrics

Training set	Min	Median	Max
Word count	6	56.2632	155

Label	Training Sample Count
alianza atletico	0
alianza lima	1
andean	0
art-culture	1
ayacucho fc	0
cinema	1
folklore	0
futsal	0
hip hop	0
others	0
party	5
rock & pop	1
sport boys	0
sporting cristal	0
stand-up	0
theater	5

Training Hyperparameters

batch_size: (8, 8)
num_epochs: (3, 3)
max_steps: -1
sampling_strategy: oversampling
num_iterations: 20
body_learning_rate: (5e-05, 5e-05)
head_learning_rate: 5e-05
loss: CosineSimilarityLoss
distance_metric: cosine_distance
margin: 0.25
end_to_end: False
use_amp: False
warmup_proportion: 0.1
seed: 42
eval_max_steps: -1
load_best_model_at_end: False

Training Results

Epoch	Step	Training Loss	Validation Loss
0.004	1	0.2656	-
0.2	50	0.0891	-
0.4	100	0.062	-
0.6	150	0.0021	-
0.8	200	0.0006	-
1.0	250	0.0003	-
1.2	300	0.0078	-
1.4	350	0.0003	-
1.6	400	0.0001	-
1.8	450	0.0001	-
2.0	500	0.0002	-
2.2	550	0.0001	-
2.4	600	0.0004	-
2.6	650	0.0001	-
2.8	700	0.0	-
3.0	750	0.0003	-
0.004	1	0.3778	-
0.2	50	0.0361	-
0.4	100	0.0069	-
0.6	150	0.0041	-
0.8	200	0.0018	-
1.0	250	0.1319	-
1.2	300	0.0011	-
1.4	350	0.0023	-
1.6	400	0.0011	-
1.8	450	0.0013	-
2.0	500	0.0005	-
2.2	550	0.0002	-
2.4	600	0.0007	-
2.6	650	0.0001	-
2.8	700	0.0001	-
3.0	750	0.0002	-
0.0105	1	0.2121	-
0.5263	50	0.0011	-
1.0526	100	0.0083	-
1.5789	150	0.0005	-
2.1053	200	0.0002	-
2.6316	250	0.0003	-

Framework Versions

Python: 3.10.14
SetFit: 1.0.3
Sentence Transformers: 3.0.1
Transformers: 4.39.0
PyTorch: 2.3.1+cu121
Datasets: 2.21.0
Tokenizers: 0.15.2

Citation

BibTeX

@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}

DiegoGCh
/

setfit-tryv1