poderia compartilhar o .safetensor e o vocab.txt tb? seria de bastante ajuda :)

#1
by Ai-Tunes - opened

poderia compartilhar o .safetensor e o vocab.txt tb? seria de bastante ajuda :)

poderia compartilhar o .safetensor e o vocab.txt tb? seria de bastante ajuda :)
irmão o safetensor você precisa converter diretamente na interface de finetune este e o modelo full e o vocab.txt e padrão do repo F5-TTS o so fazer fine tune e sai para o abraço fiquei tão feliz de encontrar este repositorio depois de ver ele falando no git ja fiz o finetune e ficou perfect

eu testei com o full so que nao ficou com sotaque brasileiro ficou sotaque de gringo

eu testei com o full so que nao ficou com sotaque brasileiro ficou sotaque de gringo

eu particulamente não testei o modelo diretamente utilizei para finetune para adiantar o trabalho mais uma dica você tem que usar o audio de referencia em portugues e tem que ter o texto de referencia igual o que esta no audio diferente de outros modelos que pega somente o pitch este parece pegar tudo exmplo -ref_text "levantara a mão contra ele e o oficial então arrancara da espada e atravessara o de lado a lado estava direito ah" \ aqui tem que ser a mesma coisa que seu audio de referente esta dizendo

"""python inference-cli.py \

Specify the model name to use for inference

--model "F5-TTS" \

Path to the model checkpoint file, which contains the saved model weights

--ckpt_file "path/to/model.pt" \

Path to the reference audio file. This file is used to capture the speaking style

and voice characteristics, which the model will try to mimic.

--ref_audio "wavs/sample_audio.wav" \

Reference text associated with the reference audio file.

This helps the model understand the speaking style.

--ref_text "levantara a mão contra ele e o oficial então arrancara da espada e atravessara o de lado a lado estava direito ah" \

Text that the model will generate speech for. This will be spoken in the style

derived from the reference audio and text.

--gen_text "O Brasil, oficialmente República Federativa do Brasil, é o maior país da América do Sul e da América Latina.""""

eu consegui um sotaque aceitavel ,mas o TTs instavel ele alucina de vez em quando

A qualidade desse treinamento ta legal pessoal?

Sign up or log in to comment