proxectonos
/

Nos_MT-OpenNMT-en-gl

Model card Files Files and versions Community

imdbo commited on Feb 24, 2023

Commit

e8817e3

•

1 Parent(s): 79bd511

Update README.md

Files changed (1) hide show

README.md +10 -3

README.md CHANGED Viewed

@@ -29,13 +29,20 @@ Auténticos e Sintéticos (Transliteração)[Colocar Paper]
 **Procedemento de adestramento**
-Tokenization feita co tokenizador de linguakit https://github.com/citiususc/Linguakit
-BPE
 **Hiperparámetros**
-Colocar o yaml para cada um dos pares
 **Avaliación**
 A avalación dos modelos é feita cunha mistura de tests desenvolvidos internamente

 **Procedemento de adestramento**
++ Tokenization dos datasets feita co tokenizador de linguakit https://github.com/citiususc/Linguakit
++ O vocabulario para os modelos foi xerado a través do script [learn_bpe.py](https://github.com/OpenNMT/OpenNMT-py/blob/master/tools/learn_bpe.py) da open NMT
++ Usando o .yaml neste repositorio pode replicar o proceso de adestramento do seguinte xeito
+```bash
+onmt_build_vocab -config  bpe-en-gl_emb.yaml -n_sample 100000
+onmt_train -config bpe-en-gl_emb.yaml
+```
 **Hiperparámetros**
+Os parámetros usados para o desenvolvimento do modelo poden ser consultados directamente no mesmo ficheiro .yaml  bpe-en-gl_emb.yaml
 **Avaliación**
 A avalación dos modelos é feita cunha mistura de tests desenvolvidos internamente