|
--- |
|
language: |
|
- ar |
|
metrics: |
|
- Accuracy |
|
library_name: transformers |
|
pipeline_tag: text2text-generation |
|
tags: |
|
- t5 |
|
- text2text-generation |
|
- text2text |
|
- Classification and Generation |
|
- Classification |
|
- Generation |
|
- ArabicT5 |
|
- Text Classification |
|
- Text2Text Generation |
|
widget: |
|
- example_title: الرياضة |
|
- text: | |
|
الاتحاد لا يستحق ركلة جزاء أمام النصر |
|
--- |
|
|
|
# # Arabic news classification and generation using transformers |
|
- In this model focus on classifying and generating news Arabic. |
|
|
|
# # The number in the generated text represents the category of the news, as shown below: |
|
category_mapping = { |
|
|
|
'Political':1, |
|
'Economy':2, |
|
'Health':3, |
|
'Sport':4, |
|
'Culture':5, |
|
'Technology':6, |
|
'Art':7, |
|
'Accidents':8 |
|
} |
|
|
|
# # Training parameters |
|
|
|
| | | |
|
| :-------------------: | :-----------:| |
|
| Training batch size | `8` | |
|
| Evaluation batch size | `8` | |
|
| Learning rate | `1e-4` | |
|
| Max length input | `64` | |
|
| Max length target | `512` | |
|
| Number workers | `4` | |
|
| Epoch | `5` | |
|
| | | |
|
|
|
# # Results |
|
|
|
| | | |
|
| :---------------------: | :-----------: | |
|
| Validation Loss | `1.77` | |
|
| Classification Accuracy | `96.17%` | |
|
| Generation Accuracy | `87.16%` | |
|
| | | |
|
|
|
# # Example usage |
|
```python |
|
|
|
from transformers import T5ForConditionalGeneration, T5Tokenizer, pipeline |
|
|
|
model_name="Hezam/ArabicT5-news-classification-generation" |
|
model = T5ForConditionalGeneration.from_pretrained(model_name) |
|
tokenizer = T5Tokenizer.from_pretrained(model_name) |
|
generation_pipeline = pipeline("text2text-generation",model=model,tokenizer=tokenizer) |
|
|
|
text = "الاتحاد لا يستحق ركلة جزاء أمام النصر" |
|
|
|
output= generation_pipeline(text, |
|
num_beams=4, |
|
max_length=512, |
|
top_p=0.9, |
|
repetition_penalty = 3.0, |
|
no_repeat_ngram_size = 3)[0]["generated_text"] |
|
|
|
output |
|
|
|
``` |
|
4 كتب حسام الحاج اكد احمد سامي المدير الفني للفريق الاول لكره القدم بنادي الاتحاد السكندري فريقه يستحق ركله جزاء في المباراه التي تجمع الفريقين اليوم الاحد استاد القاهره الدولي ضمن منافسات الجوله الرابعه والعشرين عمر مسابقه الدوري المصري الممتاز وجاء تشكيل الاتحاد كالتالي حراسه المرمي محمد الشناوي خط الدفاع حمزه المثلوثي محمود حمدي الونش حسين الشحات خط الوسط عمرو السوليه اسلام عيسي عبد الله السعيد علي معلول مصطفي الزناري خط الهجوم كريم فءاد ويجلس مقاعد بدلاء فريق الاتحاد السكندر |
|
```bash |
|
4 كتب حسام الحاج اكد احمد سامي المدير الفني للفريق الاول لكره القدم بنادي الاتحاد السكندري فريقه يستحق ركله جزاء في المباراه التي تجمع الفريقين اليوم الاحد استاد القاهره الدولي ضمن منافسات الجوله الرابعه والعشرين عمر مسابقه الدوري المصري الممتاز وجاء تشكيل الاتحاد كالتالي حراسه المرمي محمد الشناوي خط الدفاع حمزه المثلوثي محمود حمدي الونش حسين الشحات خط الوسط عمرو السوليه اسلام عيسي عبد الله السعيد علي معلول مصطفي الزناري خط الهجوم كريم فءاد ويجلس مقاعد بدلاء فريق الاتحاد السكندر |
|
``` |