vabatista commited on
Commit
d303e78
·
1 Parent(s): 7479a95

Create README.md

Browse files
Files changed (1) hide show
  1. README.md +103 -0
README.md ADDED
@@ -0,0 +1,103 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ license: afl-3.0
3
+ language:
4
+ - pt
5
+ pipeline_tag: text2text-generation
6
+ datasets:
7
+ - squad
8
+ ---
9
+ # Model Card for Model ID
10
+
11
+ <!-- Provide a quick summary of what the model is/does. -->
12
+ This model is intended to be used generating questions and answers from brazilian portuguese text passages,
13
+ so you can finetune another BERT model into your generated triples (context-question-answer) for extractive question answering without supervision or labeled data.
14
+
15
+ It was trained using [unicamp-dl/ptt5-small-t5-portuguese-vocab](https://huggingface.co/unicamp-dl/ptt5-small-t5-portuguese-vocab) base model, [Squad 1.1 portuguese version](https://huggingface.co/datasets/ArthurBaia/squad_v1_pt_br)
16
+ [Squad 2.0 portuguese version](https://github.com/cjaniake/squad_v2.0_pt) datasets to generante question and answers from text passages.
17
+
18
+ ### Model Description
19
+
20
+ <!-- Provide a longer summary of what this model is. -->
21
+
22
+
23
+
24
+ - **Developed by:** Vitor Alcantara Batista (vabatista@gmail.com)
25
+ - **Model type:** T5 small
26
+ - **Language(s) (NLP):** Brazilian Portuguese
27
+ - **License:** [Academic Free License v. 3.0](https://opensource.org/license/afl-3-0-php/)
28
+ - **Finetuned from model :** unicamp-dl/ptt5-small-t5-portuguese-vocab
29
+
30
+ ### Model Sources [optional]
31
+
32
+ <!-- Provide the basic links for the model. -->
33
+
34
+ - **Repository:** This model used code from this github repo [https://github.com/patil-suraj/question_generation/](https://github.com/patil-suraj/question_generation/)
35
+
36
+ ## Usage
37
+
38
+ <!-- Address questions around how the model is intended to be used, including the foreseeable users of the model and those affected by the model. -->
39
+
40
+ How to use it (after cloning the github repo above):
41
+
42
+ ```
43
+ from pipelines import pipeline
44
+ nlp = pipeline("question-generation", model='vabatista/question-generation-t5-small-pt-br', tokenizer='vabatista/question-generation-t5-small-pt-br')
45
+
46
+ text = """ PUT YOUR TEXT PASSAGE HERE """
47
+ nlp(text)
48
+
49
+ ```
50
+ Sample usage/results:
51
+ ```
52
+ text = """A Volkswagen anunciou a chegada do ID.Buzz, a Kombi elétrica, ao Brasil. Em campanha publicitária, a marca alemã usou tecnologia de inteligência artificial
53
+ para criar um comercial com a cantora Elis Regina, falecida em 1982, e a sua filha, a também cantora Maria Rita. Ambas aparecem cantando juntas a música 'Como Nossos Pais', composta por Belchior e eternizada por Elis.
54
+ O vídeo, que já foi divulgado nas redes sociais da marca, foi exibido pela primeira vez em comemoração de 70 anos da Volkswagen no ginásio do Ibirapuera, em São Paulo.
55
+ Diante de 5 mil pessoas, entre funcionários e convidados, a apresentação ainda contou com a presença de Maria Rita, que também cantou ao vivo a canção e se emocionou bastante -
56
+ a cantora chegou a chorar abraçada com Ciro Possobom, CEO da VW do Brasil.
57
+ A técnica utilizada, conhecida também como "deep fake", aplica IA para criar conteúdos realistas. No caso, foi produzida pela agência AlmapBBDO."""
58
+
59
+ nlp(text)
60
+
61
+ [{'answer': 'Kombi elétrica', 'question': 'Qual é o nome do ID.Buzz?'},
62
+ {'answer': 'tecnologia de inteligência artificial',
63
+ 'question': 'O que a Volkswagen usou para criar um comercial com Elis Regina?'},
64
+ {'answer': 'Como Nossos Pais',
65
+ 'question': 'Qual é o nome da música que Elis Regina cantou?'},
66
+ {'answer': '70 anos',
67
+ 'question': 'Qual foi o aniversário da Volkswagen em comemoração ao ID.Buzz?'},
68
+ {'answer': 'Ciro Possobom', 'question': 'Quem foi o CEO da VW do Brasil?'},
69
+ {'answer': 'deep fake', 'question': 'Qual é o outro nome para o ID.Buzz?'},
70
+ {'answer': 'AlmapBBDO', 'question': 'Qual agência produziu o ID.Buzz?'}]
71
+ ```
72
+
73
+ You may also use this model directly using this inputs (you can test on the sandbox in this page):
74
+
75
+ 1. extrair respostas: \<PHRASE HERE>
76
+
77
+ 2. gerar pergunta: \<HIGHLIGHTED PHRASE HERE>
78
+ where \<HIGHLIGHTED PHRASE> uses \<hl> token to highlight generated answer.
79
+
80
+ Example:
81
+
82
+ input: "extrair respostas: A Volkswagen anunciou a chegada do ID.Buzz, a Kombi elétrica, ao Brasil."
83
+
84
+ output: ID.Buzz
85
+
86
+ input: "gerar perguntas: A Volkswagen anunciou a chegada do \<hl> ID.Buzz \<hl>, a Kombi elétrica, ao Brasil."
87
+
88
+ output: "Qual é o nome da Kombi elétrica da Volkswagen no Brasil?"
89
+
90
+
91
+
92
+
93
+ ## Training Details
94
+
95
+ 10 epochs, learning-rate 1e-4
96
+
97
+ ## Model Card Authors
98
+
99
+ Vitor Alcantara Batista
100
+
101
+ ## Model Card Contact
102
+
103
+ vabatista@gmail.com