kardosdrur/hpv_keynmf_20
This repository contains a topic model trained with the Turftopic Python library.
To load and use the model run the following piece of code:
from turftopic import load_model
model = load_model(kardosdrur/hpv_keynmf_20)
model.print_topics()
Model Structure
The model is structured as follows:
KeyNMF(encoder=SentenceTransformer(
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
(1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
),
n_components=20, random_state=42, top_n=15,
vectorizer=CountVectorizer(min_df=10, stop_words='english'))
Topics
The topics discovered by the model are the following:
Topic ID | Highest Ranking |
---|---|
0 | vaccineret, vaccinationen, forældre, vaccinationer, årige, vaccinen, vaccination, kræftvaccine, vaccinationerne, vaccinationsprogram |
1 | livmoderhalskræft, måske, forebyggelse, gør, kræftform, længere, kræftformen, seneste, modtager, hvad |
2 | sundhedsstyrelsen, sundhedsstyrelsens, lægeforeningen, forældre, vaccinationsprogrammet, vaccinerne, kræftsygdom, analkræft, sundhedsvæsenet, kræfttilfælde |
3 | kræft, livmoderhalsen, kræften, halskræft, livmorhalskræft, kræftforskning, kræfttilfælde, celleforandringer, mænd, kræftfremkaldende |
4 | hpv, vaccine, vaccination, papillomavirus, gratis, vaccinationen, mænd, på, seksuelt, tilfælde |
5 | bivirkninger, hovedpine, svimmelhed, sygdom, undersøgt, træthed, indberetninger, vaccinen, sundhedsudvalget, sygdomme |
6 | kvinder, kvinderne, ældre, årige, kræftvaccine, kvinde, livmoderhalsen, celleforandringer, livmorhalskræft, vaccination |
7 | bekæmpelse, kræftens, kræftsygdom, kvinder, kræftform, vaccine, højeste, undersøgelse, kræftvaccine, bekæmpelses |
8 | undersøgelse, undersøgelsen, undersøgt, livmoderhalsen, undersøgelser, kvinderne, gynækologisk, celleforandringer, undersøge, sundhed |
9 | sygdommen, sygdom, sygdomme, årsagen, kræften, sundhed, kræftform, sygdommens, kønssygdommen, desværre |
10 | læger, lægerne, sygdomme, sundhedsvæsenet, overlæger, lægernes, sundhedsvæsen, lægefaglige, lægemiddelstyrelsen, undersøgelser |
11 | vaccinen, godkendt, vaccinationsprogrammet, vacciner, vaccinationsprogram, sundhedsmyndigheder, biotekselskab, vaccineplatform, virker, vaccinationer |
12 | også, årige, drenge, gør, politiken, gratis, ifølge, hvorfor, mænd, sidste |
13 | vaccinerede, hpvvaccinen, vaccinerne, undersøgelsen, færdigvaccinerede, videnskabelige, færdigvaccineret, hpv, højere, lægeforeningen |
14 | sundhedsminister, sundhedsministeren, sundhedsordfører, vaccinationsprogrammet, kræftvaccine, sundhedsministeriet, sundhedsudvalg, livmorhalskræft, ministeren, sundhedsmyndighederne |
15 | kønsvorter, analkræft, kønssygdomme, sygdomme, børnevaccinationsprogram, sexsygdomme, indført, klamydia, peniskræft, hvorfor |
16 | kræftformer, kræftsygdom, kræfttilfælde, brystkræft, kræftsygdomme, kræftform, tarmkræft, lungekræft, kræftpatienter, endetarmskræft |
17 | børnevaccinationsprogrammet, børnevaccinationsprogram, vaccinerne, analkræft, lægemiddelstyrelsen, kræftvaccine, vaccinationen, vaccinationer, hpvvaccinen, kræftform |
18 | læge, lægen, lægerne, sundhed, sundhedsvæsenet, kræften, sygdom, sundhedsvæsen, gør, lægeforeningen |
19 | overlæge, sundhedsstyrelsens, overlægen, gynækologisk, videnskabelig, styrelsen, gynækologi, speciallæge, forebyggelse, overlæger |
Package versions
The model in this repo was trained using the following package versions:
Package | Version |
---|---|
scikit-learn | 1.5.1 |
sentence-transformers | 3.3.0 |
turftopic | 0.8.1 |
joblib | 1.4.2 |
We recommend that you install the same, or compatible versions of these packages locally, before trying to load a model.
Inference API (serverless) does not yet support turftopic models for this pipeline type.