metadata
language:
- en
- ar
tags:
- translation
- Arabic Abjad Characters
- Arabic
license: apache-2.0
datasets:
- marefa-mt
Marefa-Mt-En-Ar
نموذج المعرفة للترجمة الآلية من الإنجليزية للعربية
Model description
This is a model for translating English to Arabic. The special about this model that is take into considration the
using of additional Arabic characters like پ
or گ
.
عن النموذج
هذا النموذج للترجمة الآلية من اللغة الإنجليزية إلى اللغة العربية, هو أول نماذج الترجمة الآلية التي تصدر تحت رعاية موسوعة المعرفة
يتميز هذا النموذج عن غيره من النماذج بدعمه لحروف الأبجدية العربية الإضافية لتمييز الصوتيات الخاصة في اللغة الإنجليزية مثل پ
, گ
.
يمكنك زيارة هذه الصفحة لمعرفة أكثر عن أسلوب إستخدام هذه الحروف الأبجدية العربية
How to use كيفية الإستخدام
Install transformers and sentencepiece (python >= 3.6)
$ pip3 install transformers==4.3.0 sentencepiece==0.1.95 nltk==3.5 protobuf==3.15.3 torch==1.7.1
If you are using
Google Colab
, please restart your runtime after installing the packages.
from transformers import MarianTokenizer, MarianMTModel
mname = "marefa-nlp/marefa-mt-en-ar"
tokenizer = MarianTokenizer.from_pretrained(mname)
model = MarianMTModel.from_pretrained(mname)
# English Sample Text
input = "President Putin went to the presidential palace in the capital, Kiev"
translated_tokens = model.generate(**tokenizer.prepare_seq2seq_batch([input], return_tensors="pt"))
translated_text = [tokenizer.decode(t, skip_special_tokens=True) for t in translated_tokens]
# translated Arabic Text
print(translated_text)
# ذهب الرئيس پوتن إلى القصر الرئاسي في العاصمة كييڤ