Maciel commited on
Commit
6685b93
1 Parent(s): 5f6e5c5

Create README.md

Browse files
Files changed (1) hide show
  1. README.md +51 -0
README.md ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ## 功能介绍
2
+ 该模型主要功能是针对mask部分进行补全生成,能够生成较流利丰富的自然文本。
3
+
4
+ 参考案例如下:
5
+
6
+ 1)今天[mask]篮球[mask]学校[mask]
7
+
8
+ 2)[mask]疫情[mask]公园[mask]散步[mask]
9
+
10
+ 3)[mask]感染新冠[mask]身体不舒服[mask]多休息[mask]
11
+
12
+ ## 如何使用
13
+ ```
14
+ from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
15
+ pretrained = "Maciel/T5_Mask_Completion"
16
+ tokenizer = AutoTokenizer.from_pretrained(pretrained)
17
+ model = AutoModelForSeq2SeqLM.from_pretrained(pretrained)
18
+
19
+ sentence = "[mask]疫情[mask]公园[mask]散步[mask]"
20
+ max_input_length = 128
21
+ input_encodings = tokenizer(sentence,
22
+ max_length=max_input_length,
23
+ truncation=True,
24
+ return_tensors="pt")
25
+ if "token_type_ids" in input_encodings.keys():
26
+ input_encodings.pop("token_type_ids")
27
+ output = model.generate(**input_encodings,
28
+ num_beams=10,
29
+ no_repeat_ngram_size=5,
30
+ do_sample=True,
31
+ early_stopping=True,
32
+ min_length=10,
33
+ max_length=64,
34
+ return_dict_in_generate=True,
35
+ output_scores=True)
36
+ decoded_output = tokenizer.batch_decode(output.sequences, skip_special_tokens=True)[0]
37
+ completion = decoded_output.strip()
38
+ print(completion)
39
+ ```
40
+
41
+ ## 案例展示
42
+ ```
43
+ 1) 原始文本:今天[mask]篮球[mask]学校[mask]
44
+ 补全文本:今天,我们来谈谈篮球与学校的关系。
45
+
46
+ 2) 原始文本:[mask]疫情[mask]公园[mask]散步[mask]
47
+ 补全文本:在疫情发生之前,人们可以在公园里散步。
48
+
49
+ 3) 原始文本:[mask]感染新冠[mask]身体不舒服[mask]多休息[mask]
50
+ 补全文本:如果你感染新冠了,身体不舒服,建议你多休息,不要吃辛辣刺激性的食物,以免加重病情。
51
+ ```