ivangtorre
/

wav2vec2-xlsr-300m-quechua

Automatic Speech Recognition

xlsr-fine-tuning

Inference Endpoints

Model card Files Files and versions Community

ivangtorre commited on May 14

Commit

5016634

•

1 Parent(s): 51a557e

Update README.md

Files changed (1) hide show

README.md +5 -3

README.md CHANGED Viewed

@@ -73,9 +73,11 @@ from transformers import Wav2Vec2ForCTC, Wav2Vec2Processor
 import torch
 from jiwer import cer
 import torch.nn.functional as F
-librispeech_eval = load_dataset("ivangtorre/second_americas_nlp_2022", split="validation")
 model = Wav2Vec2ForCTC.from_pretrained("ivangtorre/wav2vec2-xlsr-300m-quechua")
 processor = Wav2Vec2Processor.from_pretrained("ivangtorre/wav2vec2-xlsr-300m-quechua")
@@ -90,7 +92,7 @@ def map_to_pred(batch):
     batch["transcription"] = processor.batch_decode(predicted_ids)
     return batch
-result = librispeech_eval.map(map_to_pred, batched=True, batch_size=1)
 print("CER:", cer(result["source_processed"], result["transcription"]))
 ```

 import torch
 from jiwer import cer
 import torch.nn.functional as F
+from datasets import load_dataset
+import soundfile as sf
+americasnlp = load_dataset("ivangtorre/second_americas_nlp_2022", "quechua", split="dev")
+quechua = americasnlp.filter(lambda language: language['subset']=='quechua')
 model = Wav2Vec2ForCTC.from_pretrained("ivangtorre/wav2vec2-xlsr-300m-quechua")
 processor = Wav2Vec2Processor.from_pretrained("ivangtorre/wav2vec2-xlsr-300m-quechua")
     batch["transcription"] = processor.batch_decode(predicted_ids)
     return batch
+result = quechua.map(map_to_pred, batched=True, batch_size=1)
 print("CER:", cer(result["source_processed"], result["transcription"]))
 ```