proxectonos
/

Nos_MT-OpenNMT-es-gl

Model card Files Files and versions Community

imdbo commited on Feb 24, 2023

Commit

64d072b

•

1 Parent(s): b00d2fd

Update README.md

Files changed (1) hide show

README.md +12 -3

README.md CHANGED Viewed

@@ -24,15 +24,24 @@ Datos utilizados para o adestramento
 Auténticos e Sintéticos (Transliteração)[Colocar Paper]
 **Procedemento de adestramento**
-Tokenization feita co tokenizador de linguakit https://github.com/citiususc/Linguakit
-BPE Modelos proprios
 **Hiperparámetros**
-Colocar o yaml para cada um dos pares
 **Avaliación**
 A avalación dos modelos é feita cunha mistura de tests desenvolvidos internamente

 Auténticos e Sintéticos (Transliteração)[Colocar Paper]
 **Procedemento de adestramento**
++ Tokenization dos datasets feita co tokenizador de linguakit https://github.com/citiususc/Linguakit
++ O vocabulario para os modelos foi xerado a través do script [learn_bpe.py](https://github.com/OpenNMT/OpenNMT-py/blob/master/tools/learn_bpe.py) da open NMT
++ Usando o .yaml neste repositorio pode replicar o proceso de adestramento do seguinte xeito
+```bash
+onmt_build_vocab -config  bpe-es-gl_emb.yaml -n_sample 100000
+onmt_train -config bpe-es-gl_emb.yaml
+```
 **Hiperparámetros**
+Os parámetros usados para o desenvolvimento do modelo poden ser consultados directamente no mesmo ficheiro .yaml  bpe-es-gl_emb.yaml
 **Avaliación**
 A avalación dos modelos é feita cunha mistura de tests desenvolvidos internamente