sandrarrey
commited on
Commit
•
db070bb
1
Parent(s):
95ef0ae
Update README.md
Browse files
README.md
CHANGED
@@ -38,7 +38,7 @@ No adestramento, utilizamos corpora auténticos e sintéticos do [ProxectoNós](
|
|
38 |
|
39 |
+ Tokenization dos datasets feita co tokenizador de linguakit https://github.com/citiususc/Linguakit
|
40 |
|
41 |
-
+ O vocabulario para os modelos foi xerado a través do script [learn_bpe.py](https://github.com/OpenNMT/OpenNMT-py/blob/master/tools/learn_bpe.py) da
|
42 |
|
43 |
+ Usando o .yaml neste repositorio pode replicar o proceso de adestramento do seguinte xeito
|
44 |
|
|
|
38 |
|
39 |
+ Tokenization dos datasets feita co tokenizador de linguakit https://github.com/citiususc/Linguakit
|
40 |
|
41 |
+
+ O vocabulario para os modelos foi xerado a través do script [learn_bpe.py](https://github.com/OpenNMT/OpenNMT-py/blob/master/tools/learn_bpe.py) da OpenNMT
|
42 |
|
43 |
+ Usando o .yaml neste repositorio pode replicar o proceso de adestramento do seguinte xeito
|
44 |
|