Finetuning F5-Spanish
Hola, estoy interesado en hacer Finetuning del modelo F5-Spanish con una voz particular.
Mi dataset es de aproximadamente 9 horas de audio.
Estoy usando la interface gradio que viene en el repositorio original de F5-TTS.
Mi pregunta es si es posible usar el checkpoint en español "model_last.pt" de este repo y cómo.
Te agradezco mucho por hacer público tu excelente modelo y de antemano agradezco mucho tu atención.
Buenas tardes, debes modificar el código para forzar que se cargue ese y utilice ese modelo. Igualmente te recomiendo entrenar sobre el "model_1200000.safetensors" puesto que el modelo "model_last.pt" tiene información de step_count que te complicará a la hora de entrenar.
cual es la diferencia entre el mode_last.pt ? que con el normal al momento de realizar la sintensis
Para inferencia y entrenamiento es lo mismo, la única diferencia es que model_last tiene algunos metadatos pero realmente no hay ninguna razon para utilizarlo solo lo he incluido por si alguien lo quisiera
Hola Juan Pablo, antes que nada gracias por el fine tunning la verdad que es impresionante. Quería consultar si hay algún workaround para ayudar a que pronuncie palabras en inglés desde el texto, me imagino que E2 F5 no utiliza SSML. Abrazo grande!