File size: 4,049 Bytes
f211e05 0e40916 419c959 dfe7a9a 0e40916 0196e3b 2fdffb2 256d9e6 419c959 0196e3b 419c959 0196e3b 419c959 0196e3b ca20aaf 67068f2 419c959 0196e3b ee45f50 9efaf29 324480c 961c986 7bc5e31 361e612 961c986 0faefde c409b58 0faefde b25704e 604f610 0faefde 961c986 0faefde 11ee808 1798e6c 66e09b5 b24adc0 0b883d6 b24adc0 ff222fd 961c986 2e6096e 363eccd c47847c 6b8133b dec5886 c47847c 1c299fa 67068f2 9627eaf 363eccd 803967e 363eccd 803967e 6a29910 803967e 67068f2 2e6096e 67068f2 2e6096e |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 |
---
language:
- ar
metrics:
- Accuracy
library_name: transformers
pipeline_tag: text2text-generation
tags:
- t5
- text2text-generation
- text2text
- Classification and Generation
- Classification
- Generation
- ArabicT5
- Text Classification
- Text2Text Generation
widget:
- example_title: الرياضة
- text: |
الاتحاد لا يستحق ركلة جزاء أمام النصر
---
# # Arabic news classification and generation using transformers
- In this model focus on classifying and generating news Arabic.
# # The number in the generated text represents the category of the news, as shown below:
category_mapping = {
'Political':1,
'Economy':2,
'Health':3,
'Sport':4,
'Culture':5,
'Technology':6,
'Art':7,
'Accidents':8
}
# # Training parameters
| | |
| :-------------------: | :-----------:|
| Training batch size | `8` |
| Evaluation batch size | `8` |
| Learning rate | `1e-4` |
| Max length input | `64` |
| Max length target | `512` |
| Number workers | `4` |
| Epoch | `5` |
| | |
# # Results
| | |
| :---------------------: | :-----------: |
| Validation Loss | `1.77` |
| Classification Accuracy | `96.17%` |
| Generation Accuracy | `87.16%` |
| | |
# # Example usage
```python
from transformers import T5ForConditionalGeneration, T5Tokenizer, pipeline
model_name="Hezam/ArabicT5-news-classification-generation"
model = T5ForConditionalGeneration.from_pretrained(model_name)
tokenizer = T5Tokenizer.from_pretrained(model_name)
generation_pipeline = pipeline("text2text-generation",model=model,tokenizer=tokenizer)
text = "الاتحاد لا يستحق ركلة جزاء أمام النصر"
output= generation_pipeline(text,
num_beams=4,
max_length=512,
top_p=0.9,
repetition_penalty = 3.0,
no_repeat_ngram_size = 3)[0]["generated_text"]
output
```
4 كتب حسام الحاج اكد احمد سامي المدير الفني للفريق الاول لكره القدم بنادي الاتحاد السكندري فريقه يستحق ركله جزاء في المباراه التي تجمع الفريقين اليوم الاحد استاد القاهره الدولي ضمن منافسات الجوله الرابعه والعشرين عمر مسابقه الدوري المصري الممتاز وجاء تشكيل الاتحاد كالتالي حراسه المرمي محمد الشناوي خط الدفاع حمزه المثلوثي محمود حمدي الونش حسين الشحات خط الوسط عمرو السوليه اسلام عيسي عبد الله السعيد علي معلول مصطفي الزناري خط الهجوم كريم فءاد ويجلس مقاعد بدلاء فريق الاتحاد السكندر
```bash
4 كتب حسام الحاج اكد احمد سامي المدير الفني للفريق الاول لكره القدم بنادي الاتحاد السكندري فريقه يستحق ركله جزاء في المباراه التي تجمع الفريقين اليوم الاحد استاد القاهره الدولي ضمن منافسات الجوله الرابعه والعشرين عمر مسابقه الدوري المصري الممتاز وجاء تشكيل الاتحاد كالتالي حراسه المرمي محمد الشناوي خط الدفاع حمزه المثلوثي محمود حمدي الونش حسين الشحات خط الوسط عمرو السوليه اسلام عيسي عبد الله السعيد علي معلول مصطفي الزناري خط الهجوم كريم فءاد ويجلس مقاعد بدلاء فريق الاتحاد السكندر
``` |