maihuyhoat commited on
Commit
35674d5
1 Parent(s): 85488a7

Upload README.md

Browse files
Files changed (1) hide show
  1. README.md +13 -32
README.md CHANGED
@@ -8,19 +8,14 @@ tags:
8
  - translation
9
 
10
  widget:
11
- - text: "vi: VietAI là tổ chức phi lợi nhuận với sứ mệnh ươm mầm tài năng về trí tuệ nhân tạo và xây dựng một cộng đồng các chuyên gia trong lĩnh vực trí tuệ nhân tạo đẳng cấp quốc tế tại Việt Nam."
12
 
13
  license: openrail
14
  ---
15
 
16
- # EnViT5 Translation
17
 
18
- [![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/mtet-multi-domain-translation-for-english/machine-translation-on-iwslt2015-english-1)](https://paperswithcode.com/sota/machine-translation-on-iwslt2015-english-1?p=mtet-multi-domain-translation-for-english)
19
 
20
- [![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/mtet-multi-domain-translation-for-english-and/on-phomt)](https://paperswithcode.com/sota/on-phomt?p=mtet-multi-domain-translation-for-english-and)
21
-
22
-
23
- State-of-the-art English-Vietnamese and Vietnamese-English Translation models trained on [MTet](https://research.vietai.org/mtet/), [PhoMT](https://github.com/VinAIResearch/PhoMT).
24
 
25
 
26
 
@@ -28,39 +23,25 @@ State-of-the-art English-Vietnamese and Vietnamese-English Translation models tr
28
  ```python
29
  from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
30
 
31
-
32
- model_name = "VietAI/envit5-translation"
33
  tokenizer = AutoTokenizer.from_pretrained(model_name)
34
  model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
35
 
36
  inputs = [
37
- "vi: VietAI tổ chức phi lợi nhuận với sứ mệnh ươm mầm tài năng về trí tuệ nhân tạo xây dựng một cộng đồng các chuyên gia trong lĩnh vực trí tuệ nhân tạo đẳng cấp quốc tế tại Việt Nam.",
38
- "vi: Theo báo cáo mới nhất của Linkedin về danh sách việc làm triển vọng với mức lương hấp dẫn năm 2020, các chức danh công việc liên quan đến AI như Chuyên gia AI (Artificial Intelligence Specialist), Kỹ sư ML (Machine Learning Engineer) đều xếp thứ hạng cao.",
39
- "en: Our teams aspire to make discoveries that impact everyone, and core to our approach is sharing our research and tools to fuel progress in the field.",
40
- "en: We're on a journey to advance and democratize artificial intelligence through open source and open science."
41
- ]
42
 
43
  outputs = model.generate(tokenizer(inputs, return_tensors="pt", padding=True).input_ids.to('cuda'), max_length=512)
44
  print(tokenizer.batch_decode(outputs, skip_special_tokens=True))
45
 
46
- # ['en: VietAI is a non-profit organization with the mission of nurturing artificial intelligence talents and building an international - class community of artificial intelligence experts in Vietnam.',
47
- # 'en: According to the latest LinkedIn report on the 2020 list of attractive and promising jobs, AI - related job titles such as AI Specialist, ML Engineer and ML Engineer all rank high.',
48
- # 'vi: Nhóm chúng tôi khao khát tạo ra những khám phá ảnh hưởng đến mọi người, cốt lõi trong cách tiếp cận của chúng tôi là chia sẻ nghiên cứu và công cụ để thúc đẩy sự tiến bộ trong lĩnh vực này.',
49
- # 'vi: Chúng ta đang trên hành trình tiến bộ dân chủ hoá trí tuệ nhân tạo thông qua nguồn mở khoa học mở.']
 
50
 
51
  ```
52
 
53
- ## Results
54
-
55
- ![image](https://user-images.githubusercontent.com/44376091/195998681-5860e443-2071-4048-8a2b-873dcee14a72.png)
56
-
57
- ## Citation
58
- ```
59
- @misc{https://doi.org/10.48550/arxiv.2210.05610,
60
- doi = {10.48550/ARXIV.2210.05610},
61
- author = {Ngo, Chinh and Trinh, Trieu H. and Phan, Long and Tran, Hieu and Dang, Tai and Nguyen, Hieu and Nguyen, Minh and Luong, Minh-Thang},
62
- title = {MTet: Multi-domain Translation for English and Vietnamese},
63
- publisher = {arXiv},
64
- year = {2022},
65
- }
66
- ```
 
8
  - translation
9
 
10
  widget:
11
+ - text: "vi: ."
12
 
13
  license: openrail
14
  ---
15
 
16
+ # T5 Translation
17
 
 
18
 
 
 
 
 
19
 
20
 
21
 
 
23
  ```python
24
  from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
25
 
26
+ model_name = "maihuyhoat/Translate"
 
27
  tokenizer = AutoTokenizer.from_pretrained(model_name)
28
  model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
29
 
30
  inputs = [
31
+ "vi: Học viện KHTN-CN ThuDo đào tạo các khóa học về học máy trí tuệ nhân tạo với mục tiêu nâng cao năng lực cạnh tranh của Việt Nam trên trường quốc tế.",
32
+ "vi: Các công nghệ như học sâu xử ngôn ngữ tự nhiên đang được áp dụng rộng rãi trong nhiều lĩnh vực như y tế, tài chính giáo dục.",
33
+ "en: Artificial intelligence is transforming the world by enabling machines to learn from data and perform tasks that typically require human intelligence.",
34
+ "en: Collaboration between industry and academia is crucial for the advancement of AI technology and its applications."
35
+ ]
36
 
37
  outputs = model.generate(tokenizer(inputs, return_tensors="pt", padding=True).input_ids.to('cuda'), max_length=512)
38
  print(tokenizer.batch_decode(outputs, skip_special_tokens=True))
39
 
40
+ # Expected outputs:
41
+ # ['en: KHTN-CN ThuDo Academy offers courses in machine learning and artificial intelligence with the goal of enhancing Vietnam's competitiveness on the international stage.',
42
+ # 'en: Technologies such as deep learning and natural language processing are being widely applied in various fields such as healthcare, finance, and education.',
43
+ # 'vi: Trí tuệ nhân tạo đang thay đổi thế giới bằng cách cho phép máy móc học từ dữ liệu thực hiện các nhiệm vụ thường yêu cầu trí tuệ con người.',
44
+ # 'vi: Sự hợp tác giữa ngành công nghiệp và học viện là rất quan trọng đối với sự tiến bộ của công nghệ AI và các ứng dụng của nó.']
45
 
46
  ```
47