maihuyhoat
commited on
Commit
•
35674d5
1
Parent(s):
85488a7
Upload README.md
Browse files
README.md
CHANGED
@@ -8,19 +8,14 @@ tags:
|
|
8 |
- translation
|
9 |
|
10 |
widget:
|
11 |
-
- text: "vi:
|
12 |
|
13 |
license: openrail
|
14 |
---
|
15 |
|
16 |
-
#
|
17 |
|
18 |
-
[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/mtet-multi-domain-translation-for-english/machine-translation-on-iwslt2015-english-1)](https://paperswithcode.com/sota/machine-translation-on-iwslt2015-english-1?p=mtet-multi-domain-translation-for-english)
|
19 |
|
20 |
-
[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/mtet-multi-domain-translation-for-english-and/on-phomt)](https://paperswithcode.com/sota/on-phomt?p=mtet-multi-domain-translation-for-english-and)
|
21 |
-
|
22 |
-
|
23 |
-
State-of-the-art English-Vietnamese and Vietnamese-English Translation models trained on [MTet](https://research.vietai.org/mtet/), [PhoMT](https://github.com/VinAIResearch/PhoMT).
|
24 |
|
25 |
|
26 |
|
@@ -28,39 +23,25 @@ State-of-the-art English-Vietnamese and Vietnamese-English Translation models tr
|
|
28 |
```python
|
29 |
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
|
30 |
|
31 |
-
|
32 |
-
model_name = "VietAI/envit5-translation"
|
33 |
tokenizer = AutoTokenizer.from_pretrained(model_name)
|
34 |
model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
|
35 |
|
36 |
inputs = [
|
37 |
-
"vi:
|
38 |
-
"vi:
|
39 |
-
"en:
|
40 |
-
"en:
|
41 |
-
|
42 |
|
43 |
outputs = model.generate(tokenizer(inputs, return_tensors="pt", padding=True).input_ids.to('cuda'), max_length=512)
|
44 |
print(tokenizer.batch_decode(outputs, skip_special_tokens=True))
|
45 |
|
46 |
-
#
|
47 |
-
#
|
48 |
-
# '
|
49 |
-
# 'vi:
|
|
|
50 |
|
51 |
```
|
52 |
|
53 |
-
## Results
|
54 |
-
|
55 |
-
![image](https://user-images.githubusercontent.com/44376091/195998681-5860e443-2071-4048-8a2b-873dcee14a72.png)
|
56 |
-
|
57 |
-
## Citation
|
58 |
-
```
|
59 |
-
@misc{https://doi.org/10.48550/arxiv.2210.05610,
|
60 |
-
doi = {10.48550/ARXIV.2210.05610},
|
61 |
-
author = {Ngo, Chinh and Trinh, Trieu H. and Phan, Long and Tran, Hieu and Dang, Tai and Nguyen, Hieu and Nguyen, Minh and Luong, Minh-Thang},
|
62 |
-
title = {MTet: Multi-domain Translation for English and Vietnamese},
|
63 |
-
publisher = {arXiv},
|
64 |
-
year = {2022},
|
65 |
-
}
|
66 |
-
```
|
|
|
8 |
- translation
|
9 |
|
10 |
widget:
|
11 |
+
- text: "vi: ."
|
12 |
|
13 |
license: openrail
|
14 |
---
|
15 |
|
16 |
+
# T5 Translation
|
17 |
|
|
|
18 |
|
|
|
|
|
|
|
|
|
19 |
|
20 |
|
21 |
|
|
|
23 |
```python
|
24 |
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
|
25 |
|
26 |
+
model_name = "maihuyhoat/Translate"
|
|
|
27 |
tokenizer = AutoTokenizer.from_pretrained(model_name)
|
28 |
model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
|
29 |
|
30 |
inputs = [
|
31 |
+
"vi: Học viện KHTN-CN ThuDo đào tạo các khóa học về học máy và trí tuệ nhân tạo với mục tiêu nâng cao năng lực cạnh tranh của Việt Nam trên trường quốc tế.",
|
32 |
+
"vi: Các công nghệ như học sâu và xử lý ngôn ngữ tự nhiên đang được áp dụng rộng rãi trong nhiều lĩnh vực như y tế, tài chính và giáo dục.",
|
33 |
+
"en: Artificial intelligence is transforming the world by enabling machines to learn from data and perform tasks that typically require human intelligence.",
|
34 |
+
"en: Collaboration between industry and academia is crucial for the advancement of AI technology and its applications."
|
35 |
+
]
|
36 |
|
37 |
outputs = model.generate(tokenizer(inputs, return_tensors="pt", padding=True).input_ids.to('cuda'), max_length=512)
|
38 |
print(tokenizer.batch_decode(outputs, skip_special_tokens=True))
|
39 |
|
40 |
+
# Expected outputs:
|
41 |
+
# ['en: KHTN-CN ThuDo Academy offers courses in machine learning and artificial intelligence with the goal of enhancing Vietnam's competitiveness on the international stage.',
|
42 |
+
# 'en: Technologies such as deep learning and natural language processing are being widely applied in various fields such as healthcare, finance, and education.',
|
43 |
+
# 'vi: Trí tuệ nhân tạo đang thay đổi thế giới bằng cách cho phép máy móc học từ dữ liệu và thực hiện các nhiệm vụ thường yêu cầu trí tuệ con người.',
|
44 |
+
# 'vi: Sự hợp tác giữa ngành công nghiệp và học viện là rất quan trọng đối với sự tiến bộ của công nghệ AI và các ứng dụng của nó.']
|
45 |
|
46 |
```
|
47 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|