Spaces:

Kr08
/

ASR

Build error

Kr08 commited on Nov 13, 2024

Commit

feed7c4

verified ·

1 Parent(s): 37ddb1d

Update audio_processing.py

Files changed (1) hide show

audio_processing.py CHANGED Viewed

@@ -55,7 +55,7 @@ class AudioProcessor:
         """Identify language of audio chunk"""
         lid_model, lid_processor = models['lid']
         inputs = lid_processor(audio_chunk, sampling_rate=16000, return_tensors="pt")
         with torch.no_grad():
             outputs = lid_model(inputs.input_values.to(self.device)).logits
             lang_id = torch.argmax(outputs, dim=-1)[0].item()
@@ -70,7 +70,7 @@ class AudioProcessor:
         mms_processor.tokenizer.set_target_lang(language)
         mms_model.load_adapter(language)
         inputs = mms_processor(audio_chunk, sampling_rate=16000, return_tensors="pt")
         with torch.no_grad():
@@ -87,7 +87,7 @@ class AudioProcessor:
         inputs = translation_tokenizer(text, return_tensors="pt")
         inputs = inputs.to(self.device)
         with torch.no_grad():
             outputs = translation_model.generate(
                 **inputs,

         """Identify language of audio chunk"""
         lid_model, lid_processor = models['lid']
         inputs = lid_processor(audio_chunk, sampling_rate=16000, return_tensors="pt")
+        lid_model.to(self.device)
         with torch.no_grad():
             outputs = lid_model(inputs.input_values.to(self.device)).logits
             lang_id = torch.argmax(outputs, dim=-1)[0].item()
         mms_processor.tokenizer.set_target_lang(language)
         mms_model.load_adapter(language)
+        mms_model.to(self.device)
         inputs = mms_processor(audio_chunk, sampling_rate=16000, return_tensors="pt")
         with torch.no_grad():
         inputs = translation_tokenizer(text, return_tensors="pt")
         inputs = inputs.to(self.device)
+        translation_model.to(self.device)
         with torch.no_grad():
             outputs = translation_model.generate(
                 **inputs,