Spaces:

Kr08
/

ASR_gradio

Build error

App Files Files Community

Kr08 commited on Nov 8, 2024

Commit

6241aa9

verified ·

1 Parent(s): eaed8a8

alternate translation model

Browse files

Files changed (1) hide show

app.py +12 -8

app.py CHANGED Viewed

@@ -22,14 +22,14 @@ def load_translation_model() :
     return model, tokenizer
-def alternate_translation(inputs):
-    model, tokenizer = load_translation_model()
-    tokenized_inputs = tokenizer(inputs, return_tensors='pt')
     answer = ""
     # for
-    translated_tokens = model.generate(**tokenized_inputs, forced_bos_token_id=tokenizer.convert_tokens_to_ids("eng_Latn"), max_length=100)
-    return tokenizer.batch_decode(translated_tokens, skip_special_tokens=True)[0]
 def load_qa_model():
@@ -107,7 +107,8 @@ def process_and_summarize(audio_file, translate, model_size, do_summarize=True):
     logger.info(f"Starting process_and_summarize: translate={translate}, model_size={model_size}, do_summarize={do_summarize}")
     try:
         language_segments, final_segments = transcribe_audio(audio_file, translate, model_size)
         # transcription = "Detected language changes:\n\n"
         transcription = ""
         for segment in language_segments:
@@ -120,8 +121,11 @@ def process_and_summarize(audio_file, translate, model_size, do_summarize=True):
             transcription += f"[{segment['start']:.2f}s - {segment['end']:.2f}s] ({segment['language']}) {segment['speaker']}:\n"
             transcription += f"Original: {segment['text']}\n"
             if translate:
-                transcription += f"Translated: {segment['translated']}\n"
-                full_text += segment['translated'] + " "
             else:
                 full_text += segment['text'] + " "
             transcription += "\n"

     return model, tokenizer
+def alternate_translation(translation_model, translation_tokenizer, inputs):
+    # model, tokenizer = load_translation_model()
+    tokenized_inputs = translation_tokenizer(inputs, return_tensors='pt')
     answer = ""
     # for
+    translated_tokens = translation_model.generate(**tokenized_inputs, forced_bos_token_id=tokenizer.convert_tokens_to_ids("eng_Latn"), max_length=100)
+    return translation_tokenizer.batch_decode(translated_tokens, skip_special_tokens=True)[0]
 def load_qa_model():
     logger.info(f"Starting process_and_summarize: translate={translate}, model_size={model_size}, do_summarize={do_summarize}")
     try:
         language_segments, final_segments = transcribe_audio(audio_file, translate, model_size)
+        translation_model, translation_tokenizer = load_translation_model()
         # transcription = "Detected language changes:\n\n"
         transcription = ""
         for segment in language_segments:
             transcription += f"[{segment['start']:.2f}s - {segment['end']:.2f}s] ({segment['language']}) {segment['speaker']}:\n"
             transcription += f"Original: {segment['text']}\n"
             if translate:
+                alt_trans=alternate_translation(translation_model, translation_tokenizer, segment['text'])
+                transcription += f"Translated:{alt_trans}"
+                full_text += alt_trans
+                # transcription += f"Translated: {segment['translated']}\n"
+                # full_text += segment['translated'] + " "
             else:
                 full_text += segment['text'] + " "
             transcription += "\n"