Edit model card

bertopic_beta

This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.

Usage

To use this model, please install BERTopic:

pip install -U bertopic

You can use the model as follows:

from bertopic import BERTopic
topic_model = BERTopic.load("Alprocco/bertopic_beta")

topic_model.get_topic_info()

Topic overview

  • Number of topics: 33
  • Number of training documents: 552048
Click here for an overview of all topics.
Topic ID Topic Keywords Topic Frequency Label
-1 швейцарии - 00 - добрый - подскажите - спасибо 104 -1_швейцарии_00_добрый_подскажите
0 подскажите - добрый - спасибо - здравствуйте - доброго 262869 0_подскажите_добрый_спасибо_здравствуйте
1 нужен - купить - добрый - девочки - доброго 280586 1_нужен_купить_добрый_девочки
2 обратиться - сказали - стоит - делать - документы 1264 2_обратиться_сказали_стоит_делать
3 сайте - ch - адрес - информация - напишите 762 3_сайте_ch_адрес_информация
4 новый - сказали - месяца - дней - времени 596 4_новый_сказали_месяца_дней
5 деньги - вместе - писали - 100 - людей 583 5_деньги_вместе_писали_100
6 сайте - ch - купить - онлайн - смотрите 476 6_сайте_ch_купить_онлайн
7 купити - стоит - личку - привіт - знає 410 7_купити_стоит_личку_привіт
8 посмотрите - дешевле - купить - вариант - сайте 377 8_посмотрите_дешевле_купить_вариант
9 новый - 12 - франков - личку - привет 305 9_новый_12_франков_личку
10 интересно - купить - франков - пишите - 50 300 10_интересно_купить_франков_пишите
11 карту - нужна - онлайн - доброго - год 289 11_карту_нужна_онлайн_доброго
12 группе - чате - поводу - выше - типа 288 12_группе_чате_поводу_выше
13 дело - вопрос - жизни - дают - сожалению 271 13_дело_вопрос_жизни_дают
14 посмотреть - плюс - первый - купить - вечер 217 14_посмотреть_плюс_первый_купить
15 нужна - можливо - разные - доброго - думаю 189 15_нужна_можливо_разные_доброго
16 новый - дали - номер - делать - карту 183 16_новый_дали_номер_делать
17 месяца - купить - купити - покупать - фр 168 17_месяца_купить_купити_покупать
18 купити - купить - підкажіть - 00 - можливо 149 18_купити_купить_підкажіть_00
19 места - 00 - 18 - 10 - человека 144 19_места_00_18_10
20 внимание - видела - жизни - типа - знаю 142 20_внимание_видела_жизни_типа
21 карту - деньги - дней - бесплатно - типа 138 21_карту_деньги_дней_бесплатно
22 знать - разные - написано - смотрите - нашла 138 22_знать_разные_написано_смотрите
23 нужны - обязательно - швейцарии - 12 - года 136 23_нужны_обязательно_швейцарии_12
24 адрес - дешевле - стоит - сделать - искать 132 24_адрес_дешевле_стоит_сделать
25 номер - карту - деньги - приват - нужен 128 25_номер_карту_деньги_приват
26 людей - детей - помощь - насколько - дают 126 26_людей_детей_помощь_насколько
27 дешевле - купити - купить - посмотрите - вчера 125 27_дешевле_купити_купить_посмотрите
28 возле - кантон - адрес - найти - прошу 118 28_возле_кантон_адрес_найти
29 получить - типа - купить - подскажите - знает 114 29_получить_типа_купить_подскажите
30 времени - спасибо - - - 114 30_времени_спасибо__
31 кантон - месте - сожалению - говорят - написано 107 31_кантон_месте_сожалению_говорят

Training hyperparameters

  • calculate_probabilities: True
  • language: None
  • low_memory: False
  • min_topic_size: 10
  • n_gram_range: (1, 1)
  • nr_topics: auto
  • seed_topic_list: None
  • top_n_words: 10
  • verbose: True

Framework versions

  • Numpy: 1.21.5
  • HDBSCAN: 0.8.33
  • UMAP: 0.5.4
  • Pandas: 1.2.5
  • Scikit-Learn: 1.3.0
  • Sentence-transformers: 2.2.2
  • Transformers: 4.33.2
  • Numba: 0.55.1
  • Plotly: 5.9.0
  • Python: 3.9.13
Downloads last month
2
Inference API
This model can be loaded on Inference API (serverless).