Update README.md
Browse files
README.md
CHANGED
@@ -29,7 +29,7 @@ Auténticos e Sintéticos (Transliteração)[Colocar Paper]
|
|
29 |
|
30 |
**Procedemento de adestramento**
|
31 |
|
32 |
-
Tokenization
|
33 |
|
34 |
BPE
|
35 |
|
@@ -38,7 +38,8 @@ BPE
|
|
38 |
Colocar o yaml para cada um dos pares
|
39 |
|
40 |
**Avaliación**
|
41 |
-
|
|
|
42 |
|
43 |
| GOLD 1 | GOLD 2 | FLORES | TEST-SUITE|
|
44 |
| ------------- |:-------------:| -------:|----------:|
|
|
|
29 |
|
30 |
**Procedemento de adestramento**
|
31 |
|
32 |
+
Tokenization feita co tokenizador de linguakit https://github.com/citiususc/Linguakit
|
33 |
|
34 |
BPE
|
35 |
|
|
|
38 |
Colocar o yaml para cada um dos pares
|
39 |
|
40 |
**Avaliación**
|
41 |
+
A avalación dos modelos é feita cunha mistura de tests desenvolvidos internamente
|
42 |
+
(gold1, gold2, test-suite) con outros datasets disponíbeis en galego (Flores).
|
43 |
|
44 |
| GOLD 1 | GOLD 2 | FLORES | TEST-SUITE|
|
45 |
| ------------- |:-------------:| -------:|----------:|
|