mesolitica
/

malaysian-vocos-mel-24khz

Model card Files Files and versions Community

malaysian-vocos-mel-24khz / README.md

huseinzol05's picture

Update README.md

da4870a verified 29 days ago

|

history blame contribute delete

840 Bytes

	---
	datasets:
	- mesolitica/Malaysian-Emilia
	language:
	- ms
	- en
	---
	# Malaysian Vocos

	Pretrained [charactr/vocos-mel-24khz](https://huggingface.co/charactr/vocos-mel-24khz) from scratch on [Malaysian Emilia](https://huggingface.co/datasets/mesolitica/Malaysian-Emilia) to make it more crispy for Malaysian context!

	1. We increase number of layers.
	2. We increase hidden layer size.

	Wandb at https://wandb.ai/huseinzol05/malaysian_vocos_mel_v2?nw=nwuserhuseinzol05, still on training

	## Installation

	To use Vocos only in inference mode, install it using:

	```bash
	pip install vocos
	```

	## Usage

	### Reconstruct audio from mel-spectrogram

	```python
	import torch

	from vocos import Vocos

	vocos = Vocos.from_pretrained("mesolitica/malaysian-vocos-mel-24khz")

	mel = torch.randn(1, 100, 256) # B, C, T
	audio = vocos.decode(mel)
	```