ModelsLab
/

F5-tts-brazilian

Model card Files Files and versions Community

poderia compartilhar o .safetensor e o vocab.txt tb? seria de bastante ajuda :)

by Ai-Tunes - opened Nov 12, 2024

Discussion

Ai-Tunes

Nov 12, 2024

poderia compartilhar o .safetensor e o vocab.txt tb? seria de bastante ajuda :)

traderpedroso

Nov 12, 2024

poderia compartilhar o .safetensor e o vocab.txt tb? seria de bastante ajuda :)
irmão o safetensor você precisa converter diretamente na interface de finetune este e o modelo full e o vocab.txt e padrão do repo F5-TTS o so fazer fine tune e sai para o abraço fiquei tão feliz de encontrar este repositorio depois de ver ele falando no git ja fiz o finetune e ficou perfect

Ai-Tunes

Nov 13, 2024

eu testei com o full so que nao ficou com sotaque brasileiro ficou sotaque de gringo

traderpedroso

Nov 13, 2024

eu testei com o full so que nao ficou com sotaque brasileiro ficou sotaque de gringo

eu particulamente não testei o modelo diretamente utilizei para finetune para adiantar o trabalho mais uma dica você tem que usar o audio de referencia em portugues e tem que ter o texto de referencia igual o que esta no audio diferente de outros modelos que pega somente o pitch este parece pegar tudo exmplo -ref_text "levantara a mão contra ele e o oficial então arrancara da espada e atravessara o de lado a lado estava direito ah" \ aqui tem que ser a mesma coisa que seu audio de referente esta dizendo

"""python inference-cli.py \

Specify the model name to use for inference

--model "F5-TTS" \

Path to the model checkpoint file, which contains the saved model weights

--ckpt_file "path/to/model.pt" \

Path to the reference audio file. This file is used to capture the speaking style

and voice characteristics, which the model will try to mimic.

--ref_audio "wavs/sample_audio.wav" \

Reference text associated with the reference audio file.

This helps the model understand the speaking style.

--ref_text "levantara a mão contra ele e o oficial então arrancara da espada e atravessara o de lado a lado estava direito ah" \

Text that the model will generate speech for. This will be spoken in the style

derived from the reference audio and text.

--gen_text "O Brasil, oficialmente República Federativa do Brasil, é o maior país da América do Sul e da América Latina.""""

Ai-Tunes

Nov 15, 2024

eu consegui um sotaque aceitavel ,mas o TTs instavel ele alucina de vez em quando

Falkker

Nov 25, 2024

A qualidade desse treinamento ta legal pessoal?

tribuzeus

Dec 10, 2024

•

edited Dec 10, 2024

Salve a todos. Eu baixei o model_2600000.pt, mas o voice-pro com F5TTS requer o formato .safetensors.
Como que faz pra converter em .safetensors ou configurar pra que aceite .pt? Obrigado
Edit: fiz a conversão com python, mas não funcionou. Mesmo sotaque gringo.

adrianobolder

Dec 15, 2024

Utilize esse como ponto de partida. Os modelos que você encontra online geralmente não são 100% precisos. Pegue o arquivo .pt e trabalhe em cima dele com seu treinamento. É justamente o que eu faria, pois poupa tempo. Para que fique perfeito para o que você pretende fazer, é necessário melhorá-lo. Temos até que agradecer ao amigo por disponibilizá-lo, pois isso demanda tempo para ser feito.

AbhishekTiwariAKT

ModelsLab org Jan 14

•

edited Jan 14

@adrianobolder @tribuzeus @Ai-Tunes
can someone send me a better checkpoint using your datasets in brazilian portuguese?

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

Your need to confirm your account before you can post a new comment.

· Sign up or log in to comment