Update README.md
Browse files
README.md
CHANGED
@@ -36,7 +36,7 @@ No adestramento, utilizamos corpora auténticos e sintéticos do [ProxectoNós](
|
|
36 |
|
37 |
**Procedemento de adestramento / Training process**
|
38 |
|
39 |
-
+
|
40 |
|
41 |
+ O vocabulario para os modelos foi xerado a través do script [learn_bpe.py](https://github.com/OpenNMT/OpenNMT-py/blob/master/tools/learn_bpe.py) da OpenNMT
|
42 |
|
@@ -51,7 +51,8 @@ onmt_train -config bpe-en-gl_emb.yaml
|
|
51 |
|
52 |
Os parámetros usados para o desenvolvemento do modelo poden ser consultados directamente no mesmo ficheiro .yaml bpe-en-gl_emb.yaml
|
53 |
|
54 |
-
**Avaliación**
|
|
|
55 |
A avalación BLEU dos modelos é feita cunha mistura de tests desenvolvidos internamente (gold1, gold2, test-suite) con outros datasets disponíbeis en galego (Flores).
|
56 |
|
57 |
| GOLD 1 | GOLD 2 | FLORES | TEST-SUITE|
|
|
|
36 |
|
37 |
**Procedemento de adestramento / Training process**
|
38 |
|
39 |
+
+ Tokenización dos datasets feita co tokenizador de linguakit https://github.com/citiususc/Linguakit
|
40 |
|
41 |
+ O vocabulario para os modelos foi xerado a través do script [learn_bpe.py](https://github.com/OpenNMT/OpenNMT-py/blob/master/tools/learn_bpe.py) da OpenNMT
|
42 |
|
|
|
51 |
|
52 |
Os parámetros usados para o desenvolvemento do modelo poden ser consultados directamente no mesmo ficheiro .yaml bpe-en-gl_emb.yaml
|
53 |
|
54 |
+
**Avaliación**
|
55 |
+
|
56 |
A avalación BLEU dos modelos é feita cunha mistura de tests desenvolvidos internamente (gold1, gold2, test-suite) con outros datasets disponíbeis en galego (Flores).
|
57 |
|
58 |
| GOLD 1 | GOLD 2 | FLORES | TEST-SUITE|
|