Edit model card

kardosdrur/hpv_keynmf_20

This repository contains a topic model trained with the Turftopic Python library.

To load and use the model run the following piece of code:

from turftopic import load_model

model = load_model(kardosdrur/hpv_keynmf_20)
model.print_topics()

Model Structure

The model is structured as follows:

KeyNMF(encoder=SentenceTransformer(
  (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel 
  (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
  (2): Normalize()
),
       n_components=20, random_state=42, top_n=15,
       vectorizer=CountVectorizer(min_df=10, stop_words='english'))

Topics

The topics discovered by the model are the following:

Topic ID Highest Ranking
0 vaccineret, vaccinationen, forældre, vaccinationer, årige, vaccinen, vaccination, kræftvaccine, vaccinationerne, vaccinationsprogram
1 livmoderhalskræft, måske, forebyggelse, gør, kræftform, længere, kræftformen, seneste, modtager, hvad
2 sundhedsstyrelsen, sundhedsstyrelsens, lægeforeningen, forældre, vaccinationsprogrammet, vaccinerne, kræftsygdom, analkræft, sundhedsvæsenet, kræfttilfælde
3 kræft, livmoderhalsen, kræften, halskræft, livmorhalskræft, kræftforskning, kræfttilfælde, celleforandringer, mænd, kræftfremkaldende
4 hpv, vaccine, vaccination, papillomavirus, gratis, vaccinationen, mænd, på, seksuelt, tilfælde
5 bivirkninger, hovedpine, svimmelhed, sygdom, undersøgt, træthed, indberetninger, vaccinen, sundhedsudvalget, sygdomme
6 kvinder, kvinderne, ældre, årige, kræftvaccine, kvinde, livmoderhalsen, celleforandringer, livmorhalskræft, vaccination
7 bekæmpelse, kræftens, kræftsygdom, kvinder, kræftform, vaccine, højeste, undersøgelse, kræftvaccine, bekæmpelses
8 undersøgelse, undersøgelsen, undersøgt, livmoderhalsen, undersøgelser, kvinderne, gynækologisk, celleforandringer, undersøge, sundhed
9 sygdommen, sygdom, sygdomme, årsagen, kræften, sundhed, kræftform, sygdommens, kønssygdommen, desværre
10 læger, lægerne, sygdomme, sundhedsvæsenet, overlæger, lægernes, sundhedsvæsen, lægefaglige, lægemiddelstyrelsen, undersøgelser
11 vaccinen, godkendt, vaccinationsprogrammet, vacciner, vaccinationsprogram, sundhedsmyndigheder, biotekselskab, vaccineplatform, virker, vaccinationer
12 også, årige, drenge, gør, politiken, gratis, ifølge, hvorfor, mænd, sidste
13 vaccinerede, hpvvaccinen, vaccinerne, undersøgelsen, færdigvaccinerede, videnskabelige, færdigvaccineret, hpv, højere, lægeforeningen
14 sundhedsminister, sundhedsministeren, sundhedsordfører, vaccinationsprogrammet, kræftvaccine, sundhedsministeriet, sundhedsudvalg, livmorhalskræft, ministeren, sundhedsmyndighederne
15 kønsvorter, analkræft, kønssygdomme, sygdomme, børnevaccinationsprogram, sexsygdomme, indført, klamydia, peniskræft, hvorfor
16 kræftformer, kræftsygdom, kræfttilfælde, brystkræft, kræftsygdomme, kræftform, tarmkræft, lungekræft, kræftpatienter, endetarmskræft
17 børnevaccinationsprogrammet, børnevaccinationsprogram, vaccinerne, analkræft, lægemiddelstyrelsen, kræftvaccine, vaccinationen, vaccinationer, hpvvaccinen, kræftform
18 læge, lægen, lægerne, sundhed, sundhedsvæsenet, kræften, sygdom, sundhedsvæsen, gør, lægeforeningen
19 overlæge, sundhedsstyrelsens, overlægen, gynækologisk, videnskabelig, styrelsen, gynækologi, speciallæge, forebyggelse, overlæger

Package versions

The model in this repo was trained using the following package versions:

Package Version
scikit-learn 1.5.1
sentence-transformers 3.3.0
turftopic 0.8.1
joblib 1.4.2

We recommend that you install the same, or compatible versions of these packages locally, before trying to load a model.

Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Examples
Inference API (serverless) does not yet support turftopic models for this pipeline type.