vidtext_distil

Sleeping

App Files Files Community

tensorkelechi commited on Apr 19, 2024

Commit

5e0aea9

verified ·

1 Parent(s): def4cb3

Update app.py

Browse files

Files changed (1) hide show

app.py +8 -8

app.py CHANGED Viewed

@@ -18,7 +18,8 @@ st.set_page_config(
     page_title="VidText"
 )
-def youtube_video_downloader(url):
     yt_vid = YouTube(url)
     title = yt_vid.title
     vid_dld = (
@@ -32,11 +33,10 @@ def youtube_video_downloader(url):
 def audio_extraction(video_file, output_format):
-    # temp_filename = video_file.name
-    # video_path = f"{temp_filename}"
     audio = extract_audio(
-        input_path=os.
-fspath(video_file), output_path=f"{str(video_file)[:-4]}.mp3", output_format=f"{output_format}"
     )
     return audio
@@ -53,7 +53,7 @@ def load_asr_model():
     asr_model = pipeline(task="automatic-speech-recognition", model="openai/whisper-large-v3")
     return asr_model
-def transcribe_video(processed_audio):
     # stime = time.time()
     transcriber_model = load_asr_model()
     text_extract = transcriber_model(processed_audio)
@@ -83,7 +83,7 @@ with youtube_url_tab:
                with st.spinner("Transcribing..."):
                    audio = audio_extraction(os.fspath(yt_video), "mp3")
                    audio = audio_processing(audio)
-                   ytvideo_transcript = transcribe_video(audio)
                st.success(f"Transcription successful")
                st.write(ytvideo_transcript)
                # st.write(f'Completed in {run_time}')
@@ -109,7 +109,7 @@ with file_select_tab:
                with st.spinner("Transcribing..."):
                    audio = audio_extraction(video_file, "mp3")
                    audio = audio_processing(audio)
-                   video_transcript = transcribe_video(audio)
                    st.success(f"Transcription successful")
                    st.write(video_transcript)

     page_title="VidText"
 )
+def youtube_video_downloader
+(url):
     yt_vid = YouTube(url)
     title = yt_vid.title
     vid_dld = (
 def audio_extraction(video_file, output_format):
+    temp_filename = video_file.name
+    video_path = f"{temp_filename}"
     audio = extract_audio(
+        input_path=os.fspath(video_file), output_path=f"{str(video_path)[:-4]}.mp3", output_format=f"{output_format}"
     )
     return audio
     asr_model = pipeline(task="automatic-speech-recognition", model="openai/whisper-large-v3")
     return asr_model
+def transcriber_pass(processed_audio):
     # stime = time.time()
     transcriber_model = load_asr_model()
     text_extract = transcriber_model(processed_audio)
                with st.spinner("Transcribing..."):
                    audio = audio_extraction(os.fspath(yt_video), "mp3")
                    audio = audio_processing(audio)
+                   ytvideo_transcript = transcriber_pass(audio)
                st.success(f"Transcription successful")
                st.write(ytvideo_transcript)
                # st.write(f'Completed in {run_time}')
                with st.spinner("Transcribing..."):
                    audio = audio_extraction(video_file, "mp3")
                    audio = audio_processing(audio)
+                   video_transcript = transcriber_pass(audio)
                    st.success(f"Transcription successful")
                    st.write(video_transcript)