Finetuning F5-Spanish

#14

by Ehele - opened Feb 7

Feb 7

Hola, estoy interesado en hacer Finetuning del modelo F5-Spanish con una voz particular.
Mi dataset es de aproximadamente 9 horas de audio.
Estoy usando la interface gradio que viene en el repositorio original de F5-TTS.
Mi pregunta es si es posible usar el checkpoint en español "model_last.pt" de este repo y cómo.
Te agradezco mucho por hacer público tu excelente modelo y de antemano agradezco mucho tu atención.

jpgallegoar

Owner Feb 10

Buenas tardes, debes modificar el código para forzar que se cargue ese y utilice ese modelo. Igualmente te recomiendo entrenar sobre el "model_1200000.safetensors" puesto que el modelo "model_last.pt" tiene información de step_count que te complicará a la hora de entrenar.

wqewqz

26 days ago

cual es la diferencia entre el mode_last.pt ? que con el normal al momento de realizar la sintensis

jpgallegoar

Owner 25 days ago

•

edited 25 days ago

Para inferencia y entrenamiento es lo mismo, la única diferencia es que model_last tiene algunos metadatos pero realmente no hay ninguna razon para utilizarlo solo lo he incluido por si alguien lo quisiera

thedarsideofit

6 days ago

Hola Juan Pablo, antes que nada gracias por el fine tunning la verdad que es impresionante. Quería consultar si hay algún workaround para ayudar a que pronuncie palabras en inglés desde el texto, me imagino que E2 F5 no utiliza SSML. Abrazo grande!

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

Your need to confirm your account before you can post a new comment.

· Sign up or log in to comment