Create README.md
Browse files
README.md
ADDED
@@ -0,0 +1,54 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
---
|
2 |
+
language:
|
3 |
+
- vi
|
4 |
+
tags:
|
5 |
+
- vi-T5
|
6 |
+
- paraphase
|
7 |
+
- sentence-paraphase
|
8 |
+
---
|
9 |
+
This is tool for paraphase Vietnamese sentence.
|
10 |
+
### How to run
|
11 |
+
For more details, do check out [our Github repo](https://github.com/nqchieutb01/vietnamese-sentence-paraphase).
|
12 |
+
|
13 |
+
```python
|
14 |
+
CKPT = 'chieunq/vietnamese-sentence-paraphase-v1'
|
15 |
+
from transformers import MT5Tokenizer, MT5ForConditionalGeneration
|
16 |
+
tokenizer = MT5Tokenizer.from_pretrained(CKPT)
|
17 |
+
model = MT5ForConditionalGeneration.from_pretrained(CKPT)
|
18 |
+
def paraphase(text):
|
19 |
+
inputs = tokenizer(text, padding='longest', max_length=64, return_tensors='pt')
|
20 |
+
input_ids = inputs.input_ids
|
21 |
+
attention_mask = inputs.attention_mask
|
22 |
+
output = model.generate(input_ids, attention_mask=attention_mask, max_length=64)
|
23 |
+
return tokenizer.decode(output[0], skip_special_tokens=True)
|
24 |
+
|
25 |
+
texts = ["Làm sao để sống tốt đời đẹp đạo",
|
26 |
+
"Bài học tốt nhất trong cuộc sống là gì?",
|
27 |
+
"Các bước chuẩn bị phỏng vấn tại Google",
|
28 |
+
"Vì sao phụ nữ thường sống thọ hơn đàn ông?",
|
29 |
+
"Nắng nóng bắt đầu xảy ra ở nhiều nơi tại Bắc Bộ và sẽ tiếp tục tăng nhiệt trong vài ngày tới."
|
30 |
+
]
|
31 |
+
for text in texts:
|
32 |
+
print(f'Input: {text}')
|
33 |
+
print(f'Output: {paraphase(text)}')
|
34 |
+
print('-'*100)
|
35 |
+
|
36 |
+
```
|
37 |
+
### Output
|
38 |
+
```
|
39 |
+
Input: Làm sao để sống tốt đời đẹp đạo
|
40 |
+
Output: Làm thế nào để tôi sống tốt đẹp
|
41 |
+
----------------------------------------------------------------------------------------------------
|
42 |
+
Input: Bài học tốt nhất trong cuộc sống là gì?
|
43 |
+
Output: Bài học cuộc sống tốt nhất là gì?
|
44 |
+
----------------------------------------------------------------------------------------------------
|
45 |
+
Input: Các bước chuẩn bị phỏng vấn tại Google
|
46 |
+
Output: Các bước chuẩn bị cho cuộc phỏng vấn tại Google là gì?
|
47 |
+
----------------------------------------------------------------------------------------------------
|
48 |
+
Input: Vì sao phụ nữ thường sống thọ hơn đàn ông?
|
49 |
+
Output: Tại sao phụ nữ sống thọ hơn đàn ông?
|
50 |
+
----------------------------------------------------------------------------------------------------
|
51 |
+
Input: Nắng nóng bắt đầu xảy ra ở nhiều nơi tại Bắc Bộ và sẽ tiếp tục tăng nhiệt trong vài ngày tới.
|
52 |
+
Output: Nắng nóng bắt đầu xảy ra ở Bắc Bộ và sẽ tiếp tục tăng nhiệt trong vài ngày tới.
|
53 |
+
----------------------------------------------------------------------------------------------------
|
54 |
+
```
|