Spaces:

NeuralFalcon
/

Whisper-Turbo-Subtitle

Running

App Files Files Community

NeuralFalcon commited on Oct 21, 2024

Commit

920380e

verified ·

1 Parent(s): 80e7dca

Update app.py

Browse files

Files changed (1) hide show

app.py +16 -6

app.py CHANGED Viewed

@@ -176,10 +176,15 @@ def generate_srt_from_sentences(sentence_timestamp, srt_path="default_subtitle.s
             end_time = convert_time_to_srt_format(sentence['end'])
             srt_file.write(f"{index + 1}\n{start_time} --> {end_time}\n{sentence['text']}\n\n")
 def whisper_subtitle(uploaded_file,Source_Language,max_words_per_subtitle=8):
-  global language_dict,base_path
   #Load model
   if torch.cuda.is_available():
       # If CUDA is available, use GPU with float16 precision
@@ -191,7 +196,7 @@ def whisper_subtitle(uploaded_file,Source_Language,max_words_per_subtitle=8):
       device = "cpu"
       compute_type = "int8"
   faster_whisper_model = WhisperModel("deepdml/faster-whisper-large-v3-turbo-ct2",device=device, compute_type=compute_type)
-  audio_path=uploaded_file
   if Source_Language=="Automatic":
       segments,d = faster_whisper_model.transcribe(audio_path, word_timestamps=True)
       lang_code=d.language
@@ -210,7 +215,7 @@ def whisper_subtitle(uploaded_file,Source_Language,max_words_per_subtitle=8):
   #setup srt file names
   base_name = os.path.basename(uploaded_file).rsplit('.', 1)[0][:30]
-  save_name = f"{base_path}/generated_subtitle/{base_name}_{src_lang}.srt"
   original_srt_name=clean_file_name(save_name)
   original_txt_name=original_srt_name.replace(".srt",".txt")
   word_level_srt_name=original_srt_name.replace(".srt","_word_level.srt")
@@ -239,8 +244,13 @@ import gradio as gr
 import click
 base_path="."
-if not os.path.exists(f"{base_path}/generated_subtitle"):
-    os.makedirs(f"{base_path}/generated_subtitle", exist_ok=True)
 source_lang_list = ['Automatic']
 available_language=language_dict.keys()

             end_time = convert_time_to_srt_format(sentence['end'])
             srt_file.write(f"{index + 1}\n{start_time} --> {end_time}\n{sentence['text']}\n\n")
+def get_audio_file(uploaded_file):
+    global temp_folder
+    file_path = os.path.join(temp_folder, os.path.basename(uploaded_file))
+    file_path=clean_file_name(file_path)
+    shutil.copy(uploaded_file, file_path)
+    return file_path
 def whisper_subtitle(uploaded_file,Source_Language,max_words_per_subtitle=8):
+  global language_dict,base_path,subtitle_folder
   #Load model
   if torch.cuda.is_available():
       # If CUDA is available, use GPU with float16 precision
       device = "cpu"
       compute_type = "int8"
   faster_whisper_model = WhisperModel("deepdml/faster-whisper-large-v3-turbo-ct2",device=device, compute_type=compute_type)
+  audio_path=get_audio_file(uploaded_file)
   if Source_Language=="Automatic":
       segments,d = faster_whisper_model.transcribe(audio_path, word_timestamps=True)
       lang_code=d.language
   #setup srt file names
   base_name = os.path.basename(uploaded_file).rsplit('.', 1)[0][:30]
+  save_name = f"{subtitle_folder}/{base_name}_{src_lang}.srt"
   original_srt_name=clean_file_name(save_name)
   original_txt_name=original_srt_name.replace(".srt",".txt")
   word_level_srt_name=original_srt_name.replace(".srt","_word_level.srt")
 import click
 base_path="."
+subtitle_folder=f"{base_path}/generated_subtitle"
+temp_folder = f"{base_path}/subtitle_audio"
+if not os.path.exists(subtitle_folder):
+    os.makedirs(subtitle_folder, exist_ok=True)
+if not os.path.exists(temp_folder):
+    os.makedirs(temp_folder, exist_ok=True)
 source_lang_list = ['Automatic']
 available_language=language_dict.keys()