Edit model card

Flash-IT-HA-Classifier-Cossim-Extended

This is a sentence-transformers model trained. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Maximum Sequence Length: 512 tokens
  • Output Dimensionality: 768 tokens
  • Similarity Function: Cosine Similarity
  • Language: it

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel 
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("mrinaldi/flash-it-ha-classifier-cossim-fpt")
# Run inference
sentences = [
    "\n\nCome tutti gli appassionati di della serie TV _Boris_ sanno, il regista René Ferretti, interpretato da Francesco Pannofino, sceglie come compagno di viaggio per ogni suo nuovo progetto professionale un pesce rosso. I pesci rossi si susseguono, avendo tutti una caratteristica in comune: a ognuno di loro viene dato il nome di un grande giocatore di tennis, sport che René segue con grande passione. I pesci rossi del regista di Fiano Romano costituiscono infatti un viaggio attraverso decenni di tennis: Stan Smith, Adriano Panatta, John McEnroe, Ivan Lendl, Boris Becker, Michael Chang, Vanessa e Serena Williams e Roger Federer. Va rilevato che i pesci rossi di René hanno in comune, loro malgrado, anche un'altra caratteristica, ovvero quella di essere associati dal loro padrone a prodotti culturali scadenti, di bassa qualità: per usare le sue parole, fatti “a ca**o di cane”.Ma tra tanti pesci spunta una formica, la formica rossa che dà il titolo a un [pregevole cortometraggio](<https://www.youtube.com/watch?v=KKLM8OkncBo>) realizzato dal personaggio interpretato da Pannofino, in cui alle raffinate immagini che non vogliono affatto compiacere un pubblico digiuno di ogni linguaggio filmico si accompagna uno script altrettanto importante, poetico e pregno di valori forti e dal grande afflato umanistico. Anche in questo caso la dedica va a un tennista, [Arthur Ashe](<https://it.wikipedia.org/wiki/Arthur_Ashe>), che nasceva il 10 luglio di 80 anni fa. Non è un caso che a lui sia dedicato il cortometraggio che trasmette i più nobili valori perché è questo che Ashe ha fatto nella sua vita, con la parola e soprattutto con l'esempio. Il tennista afroamericano sosteneva che un campione è colui che lascia il suo sport migliore di come lo ha trovato e lui è riuscito ad andare anche oltre, lasciando il mondo migliore di come lo aveva trovato. E tutto questo lo ha fatto tenendo fede al suo concetto di eroismo, sobrio e non drammatico, mirato non al superamento degli altri ma al loro aiuto.  \n[Abbonati a MicroMega](<https://beacons.ai/micromega_rivista_abbonamenti>)  \nCome tennista, Arthur Ashe ha vinto quattro Coppe Davis, un US Open (e oggi il campo centrale di Flushing Meadows [porta il suo nome](<https://it.wikipedia.org/wiki/Arthur_Ashe_Stadium>)), un Australian Open e un Wimbledon, superando nell'epica finale del 1975 il favorito Jimmy Connors. Una sfida, ancor prima che tra due tennisti, tra due esseri umani che non avrebbero potuto essere più diversi, almeno a giudicare dalle loro figure pubbliche: riflessivo e compassato Ashe, esplosivo e irruento Connors. “Jimbo” era il grande favorito, avendo come sua principale alleata una giovinezza che lo poneva su un piano vantaggioso nell’affrontare Ashe, già 32enne. Sfavorito sul piano atletico, Ashe vinse sul piano tattico e mentale, una vittoria conseguita con gli stessi ingredienti che l’anno prima erano valsi a Muhammad Alì [la riconquista del titolo dei pesi massimi](<https://it.wikipedia.org/wiki/The_Rumble_in_the_Jungle>) a Kinshasa contro George Foreman, ugualmente più giovane e favorito. Ashe appartiene alla stretta cerchia di atleti in cui si inserisce lo stesso Alì, ossia di coloro che, pur avendo eccelso nel loro sport, se ne sono serviti in fondo come punto di partenza, come trampolino da cui lanciarsi per ottenere qualcosa di molto più grande.  \nCosì come Alì è partito dalla boxe per prendere a pugni il razzismo, altrettanto ha fatto Ashe iniziando dal tennis, agendo però con la sottile delicatezza di una voleè o di un lob. La sua lotta contro l’apartheid che allora attanagliava il Sudafrica ne è un chiaro e fulgido esempio. Ashe infatti ha sfidato il Paese mostrandone le iniquità, vedendosi rifiutato il visto per giocare all’Open di Johannesburg a partire dal 1968. Il Sudafrica venne squalificato dalla Coppa Davis nel 1972, per esservi riammesso l’anno dopo ad alcune condizioni, una delle quali era proprio l’ammissione di Ashe al torneo. Il 20 novembre del 1973 il tennista di [Richmond](<https://www.ubitennis.com/blog/2023/02/06/30-anni-senza-arthur-ashe-in-realta-non-e-mai-andato-via/>) è il primo giocatore di colore a calcare il campo da tennis del più importante torneo sudafricano. Tra le condizioni poste a sua volta per accettare l’invito del regime sudafricano a giocare nel Paese, Ashe aveva preteso che sugli spalti non vigesse la suddivisione abituale tra bianchi e neri, che sedevano in settori diversi; la richiesta sarà in parte disattesa, ma si tratterà di uno dei colpi di coda di un regime destinato a crollare, anche sotto i colpi dell’eroismo sobrio di Ashe. [Come ci racconta](<https://www.ubitennis.com/sport/tennis/2013/11/20/985140-sfida_storica_ashe_sudafrica.shtml>) Alessandro Mastroluca, che gli ha dedicato [un libro](<https://www.ibs.it/successo-viaggio-arthur-ashe-simbolo-libro-alessandro-mastroluca/e/9788867760121>), in realtà l’inizio di quella avventura umana ancor prima che sportiva non fu facile, tanto che alcuni giornalisti di colore che lo incontrano prima del torneo lo accusarono con la sua presenza di legittimare il regime dell’apartheid e di fare sostanzialmente una passerella, una comparsata, poiché nulla sarebbe cambiato in seguito alla sua presenza; questa la risposta di Ashe: “Il progresso arriva un po' per volta: quando me ne sarò andato, qualcosa resterà”. Oltre che da quella successiva storia, la legittimazione di questa posizione gli venne da un uomo presente a un incontro con la stampa organizzatagli da Don Mattera, tra i fondatori dell’Union of Black Journalists e del Congress of South African writers, uno dei pochi giornalisti di colore a credere nella bontà della sua azione: “Tu per me sei una sfida, una sfida a non avere paura, a essere più libero. E se non lo sarò io, lo saranno i miei figli”. Appena qualche giorno dopo, il 30 novembre 1973, con la Convenzione sulla Soppressione e la Punizione del Crimine dell’Apartheid, l’Onu denunciava la discriminazione razziale in atto in Sudafrica come un “crimine contro l’umanità in violazione delle leggi internazionali”. E tre anni più tardi sarebbero stati proprio i figli a scendere in strada, dando vita a quelli che sarebbero rimasti nella storia come gli scontri di Soweto. Si tratta di una protesta studentesca a seguito di un decreto governativo che imponeva a tutte le scuole per neri di utilizzare l'afrikaans, la lingua dei coloni bianchi, come lingua paritetica all'inglese. Nel giugno del 1976 gli studenti scesero in strada appunto a Soweto, sobborgo di Johannesburg, dove la repressione della polizia fu brutale e lasciò una lunga scia di morti di fronte ai quali la comunità internazionale non poteva più in alcun modo continuare a voltarsi dall’altra parte. Proprio a Soweto nel 1974 Ashe aveva edificato [il suo centro sportivo](<https://arthurashe.ucla.edu/south-africa/>), composto da campi da tennis e anche da una libreria, a testimonianza di un’idea di integrazione resa possibile attraverso lo sport e la cultura. Il regime dell'apartheid cadrà nel 1991 e, una volta ottenuta la libertà, l'uomo simbolo proprio della lotta all'apartheid, Nelson Mandela, consapevole [dell'importanza dello sport](<https://archivio.micromega.net/il-film-della-settimana-invictus-linvincibile-di-clint-eastwood/>) nella costruzione di un corpo sociale solido e armonico, [volle incontrare proprio Arthur Ashe](<https://www.lastampa.it/blogs/2013/02/06/news/ashe-il-tennista-che-faceva-sognare-mandela-1.37249276/>), che tanto aveva fatto per un Sudafrica più libero e giusto semplicemente non arrendendosi nella sua ripetuta richiesta di visti per giocare all'Open di Johannesburg.\n\nL’impegno di Arthur Ashe non si è comunque “limitato” alla sua lotta contro l’apartheid. Laureatosi in Business Administration alla prestigiosa Università UCLA, nel cui sito è presente [una sezione](<https://arthurashe.ucla.edu/>) che mantiene viva la _legacy_ del suo celebre studente, Ashe ha rivestito un ruolo importante anche nella nascita dell’ATP, l’Association Tennis Players, quella che ancora attualmente governa il mondo del tennis professionistico. Per quanto oggi possa far storcere il naso una sorta di “sindacalizzazione” degli sportivi professionisti, ritenuti sempre e comunque dei privilegiati, va considerato che all’epoca (tra la fine degli anni Sessanta e l’inizio dei Settanta) la loro capacità di incidere nell’ambito dello sport di cui erano i mattatori era piuttosto limitata e grazie al loro sforzo collettivo nell’associarsi nell’ATP hanno potuto ottenere guadagni e tutele congrui alla loro effettiva rilevanza. Lo sport professionistico è anche lavoro, un lavoro che spesso è parte di un business globale di cui i protagonisti principali, gli atleti, se non adeguatamente consapevoli, rischiano di essere delle “manovalanze” sottopagate in rapporto agli introiti che garantiscono. Questo è anche quanto aveva capito [Diego Armando Maradona](<https://www.micromega.net/la-fede-maradoniana-napoli-celebra-il-suo-capitano-eterno/>), un altro atleta che non si limitava a praticare bene il proprio sport, il cui tentativo di istituire un sindacato per calciatori, non riconosciuto dalla FIFA, si arenò sul nascere.  \nL’ultima battaglia combattuta sua malgrado da Arthur Ashe è stata quella contro l’AIDS, avendo contratto nel 1988 il virus dell’HIV in seguito a una trasfusione. Anche in questo caso l’enorme forza morale che lo ha guidato per tutta la vita, quella che da afroamericano lo aveva portato a eccellere nello sport dei bianchi per eccellenza e a sfidare un regime iniquo come quello sudafricano, gli ha fatto affrontare la malattia in modo diverso, considerando sé stesso non come una semplice vittima del male ma come un messaggero scelto da esso per sensibilizzare il mondo (l’HIV è stato contratto anche da grandi campioni che oggi riescono a convivervi, come [Magic Johnson](<https://www.vanityfair.it/article/magic-johnson-30-anni-hiv-cosa-piu-difficile-dirlo-a-mia-moglie>) e [Greg Louganis](<https://www.repubblica.it/sport/2013/07/19/news/bentornato_divino_louganis_sono_un_sopravvissuto_ora_sposo_il_mio_compagno-63282431/>)). L’8 aprile 1992 annunciò al mondo la sua malattia, che ne causerà la morte l’anno dopo, esattamente il 6 febbraio 1993. Fiaccato nel fisico ma non nel morale, due mesi prima di morire Ashe fondò la Arthur Ashe Institute for Urban Health, per aiutare le persone dotate di un’assicurazione medica insufficiente a coprire le spese mediche, e solo una settimana prima di lasciarci concluse il suo libro scritto con il giornalista Arnold Rampersad, [_Days of Grace_](<https://www.ibs.it/giorni-di-grazia-mia-storia-ebook-arthur-ashe-arnold-rampersad/e/9788867831678>). Qui sono contenute alcune parole dedicate alla sua unica figlia, Camera Elizabeth, che lo aveva reso padre solo due anni prima di contrarre il virius, nel 1986: “Potrei non camminare con te per tutto il percorso, o anche per gran parte del percorso, mentre cammino con te adesso. Non essere arrabbiata con me se non sono lì di persona, vivo e vegeto, quando hai bisogno di me. Non vorrei altro che stare sempre con te. Non dispiacerti per me se me ne vado. Quando eravamo insieme, ti amavo profondamente e mi hai dato così tanta felicità che non potrò mai ripagarti. Camera, ovunque io sia quando il cuore fa male e sei stanca della vita, o quando inciampi e cadi e non sai se puoi rialzarti, pensa a me. Ti guarderò, sorriderò e tiferò per te”.  \nE ancora oggi, a trent’anni dalla sua scomparsa, Arthur Ashe fa il tifo per tutti quelli che, con il loro eroismo sobrio, lottano per lasciare il mondo un posto migliore di come lo hanno trovato.\n\nCREDITI FOTO: [Rob Bogaerts|Wikimedia Commons](<https://commons.wikimedia.org/wiki/Category:Arthur_Ashe?uselang=it#/media/File:ABN-wereldtennistoernooi_in_Rotterdam_Arthur_Ashe_in_actie,_Bestanddeelnr_927-7839.jpg>)\n\n \n\n \n\n \n\n \n\n \n\n \n\n \n\n \n",
    'Arthur Ashe, 80 anni fa nasceva il tennista che avrebbe reso il mondo un posto migliore',
    'Le nostre scelte irrazionali',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Evaluation

Metrics

Triplet

Metric Value
cosine_accuracy 0.8578
dot_accuracy 0.1337
manhattan_accuracy 0.8589
euclidean_accuracy 0.8597
max_accuracy 0.8597

Triplet

Metric Value
cosine_accuracy 0.8589
dot_accuracy 0.1321
manhattan_accuracy 0.8617
euclidean_accuracy 0.8617
max_accuracy 0.8617

Training Details

Training Hyperparameters

Non-Default Hyperparameters

  • eval_strategy: steps
  • per_device_train_batch_size: 64
  • per_device_eval_batch_size: 16
  • learning_rate: 2e-05
  • warmup_ratio: 0.1
  • fp16: True

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: steps
  • prediction_loss_only: True
  • per_device_train_batch_size: 64
  • per_device_eval_batch_size: 16
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 2e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 3
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.1
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: True
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: False
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • eval_use_gather_object: False
  • batch_sampler: batch_sampler
  • multi_dataset_batch_sampler: proportional

Training Logs

Epoch Step Training Loss Validation Loss ha-extended-validation_max_accuracy ha-extended-final_max_accuracy
2.7701 1000 1.4281 1.6170 0.8597 -
3.0 1083 - - - 0.8617

Framework Versions

  • Python: 3.12.2
  • Sentence Transformers: 3.2.1
  • Transformers: 4.45.2
  • PyTorch: 2.4.1+cu121
  • Accelerate: 1.0.1
  • Datasets: 3.0.1
  • Tokenizers: 0.20.1

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

TripletLoss

@misc{hermans2017defense,
    title={In Defense of the Triplet Loss for Person Re-Identification},
    author={Alexander Hermans and Lucas Beyer and Bastian Leibe},
    year={2017},
    eprint={1703.07737},
    archivePrefix={arXiv},
    primaryClass={cs.CV}
}
Downloads last month
1,789
Safetensors
Model size
111M params
Tensor type
F32
·
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.

Evaluation results