File size: 1,982 Bytes
fc6e247 78bbbca 4da3120 78bbbca 4036778 2d19a2c bac1d42 4036778 bac1d42 4036778 bac1d42 4036778 bac1d42 d2d218a |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 |
---
license: mit
language:
- fa
metrics:
- accuracy
library_name: adapter-transformers
datasets:
- Msobhi/virgool_62k
pipeline_tag: text-classification
---
Hi
I have fine-tuned ParsBert for classifying Persian text using the "Msobhi/virgool_62k" dataset, with the labels listed below:
{'استارتاپ': 0,
'اقتصاد': 1,
'امنیت سایبری': 2,
'اینترنت اشیا': 3,
'بازاریابی': 4,
'بازی رایانه ای': 5,
'برنامه نویسی': 6,
'بلاک چین': 7,
'بهره وری': 8,
'تاریخ': 9,
'تجربه کاربری': 10,
'تحصیلی و آموزشی': 11,
'حقوقی': 12,
'خانواده': 13,
'خودشناسی': 14,
'داستان': 15,
'رابطه': 16,
'روانشناسی': 17,
'زنان': 18,
'سفر': 19,
'سلامت': 20,
'سلامت روانی': 21,
'سیاست': 22,
'شبکه اجتماعی': 23,
'شغل و کار': 24,
'طراحی دیجیتال': 25,
'علوم': 26,
'عکاسی': 27,
'غذا': 28,
'فرهنگ': 29,
'فریلنسری': 30,
'فلسفه': 31,
'فیلم و سینما': 32,
'فین تک': 33,
'محیط زیست': 34,
'مذهبی': 35,
'مهاجرت': 36,
'مهندسی نرم افزار': 37,
'موسیقی': 38,
'موفقیت': 39,
'نویسندگی': 40,
'هنر': 41,
'هوا فضا': 42,
'هوش مصنوعی': 43,
'ورزشی': 44,
'پادکست': 45,
'پول رمزی': 46,
'کارآفرینی': 47,
'کتاب': 48,
'یادگیری ماشین': 49}
Utilize this code snippet to test the model. It may not be very accurate, but further training epochs could enhance its performance.
model_path = "Aminrhmni/Persian_text_classification"
from transformers import pipeline, BertForSequenceClassification, BertTokenizerFast
model = BertForSequenceClassification.from_pretrained(model_path)
tokenizer= BertTokenizerFast.from_pretrained(model_path)
nlp= pipeline("text-classification", model=model, tokenizer=tokenizer)
nlp("متن ورودی") |