Spaces:

visionaries666
/

younes_edition

Sleeping

App Files Files Community

younes21000 commited on Oct 25, 2024

Commit

96c70ac

verified ·

1 Parent(s): 9d76491

Update app.py

Browse files

Files changed (1) hide show

app.py +8 -8

app.py CHANGED Viewed

@@ -1,4 +1,3 @@
-import gradio as gr
 import whisper
 import os
 from transformers import M2M100ForConditionalGeneration, M2M100Tokenizer
@@ -36,8 +35,7 @@ def load_translation_model(target_language):
         "hi": "hi",  # Hindi
         "ja": "ja",  # Japanese
         "ko": "ko",  # Korean
-        "ru": "ru"   # Russian
     }
     target_lang_code = lang_codes.get(target_language)
     if not target_lang_code:
@@ -68,7 +66,7 @@ def format_timestamp(seconds):
     seconds = seconds % 60
     return f"{hours:02}:{minutes:02}:{seconds:02},{milliseconds:03}"
-# Write subtitles in SRT format
 def write_srt(transcription, output_file, tokenizer=None, translation_model=None):
     with open(output_file, "w") as f:
         for i, segment in enumerate(transcription['segments']):
@@ -113,9 +111,11 @@ def write_word(transcription, output_file, tokenizer=None, translation_model=Non
 # Helper function to write PDF documents
 def write_pdf(transcription, output_file, tokenizer=None, translation_model=None):
     c = canvas.Canvas(output_file, pagesize=A4)
     app_dir = os.path.dirname(os.path.abspath(__file__))
     nazanin_font_path = os.path.join(app_dir, 'B-NAZANIN.TTF')
     arial_font_path = os.path.join(app_dir, 'Arial.ttf')
@@ -184,10 +184,10 @@ def write_ppt(transcription, output_file, tokenizer=None, translation_model=None
 # Transcribing video and generating output
 def transcribe_video(video_file, language, target_language, model_name, output_format):
-    actual_model_name = whisper_models[model_name]
-    model = whisper.load_model(actual_model_name)
-    if video_file is not None:
         video_file_path = video_file.name
     else:
         raise ValueError("No video file provided. Please upload a video file.")
@@ -250,4 +250,4 @@ iface = gr.Interface(
 )
 # Run the interface
-iface.launch(share=True)

 import whisper
 import os
 from transformers import M2M100ForConditionalGeneration, M2M100Tokenizer
         "hi": "hi",  # Hindi
         "ja": "ja",  # Japanese
         "ko": "ko",  # Korean
+        "ru": "ru",  # Russian
     }
     target_lang_code = lang_codes.get(target_language)
     if not target_lang_code:
     seconds = seconds % 60
     return f"{hours:02}:{minutes:02}:{seconds:02},{milliseconds:03}"
+# Corrected write_srt function
 def write_srt(transcription, output_file, tokenizer=None, translation_model=None):
     with open(output_file, "w") as f:
         for i, segment in enumerate(transcription['segments']):
 # Helper function to write PDF documents
 def write_pdf(transcription, output_file, tokenizer=None, translation_model=None):
+    # Create PDF with A4 page size
     c = canvas.Canvas(output_file, pagesize=A4)
     app_dir = os.path.dirname(os.path.abspath(__file__))
+    # Register fonts
     nazanin_font_path = os.path.join(app_dir, 'B-NAZANIN.TTF')
     arial_font_path = os.path.join(app_dir, 'Arial.ttf')
 # Transcribing video and generating output
 def transcribe_video(video_file, language, target_language, model_name, output_format):
+    actual_model_name = whisper_models[model_name]  # Map user selection to model name
+    model = whisper.load_model(actual_model_name)  # Load the selected model
+    if video_file is not None:  # Ensure the video_file is not None
         video_file_path = video_file.name
     else:
         raise ValueError("No video file provided. Please upload a video file.")
 )
 # Run the interface
+iface.launch(share=True)