vidtext_distil

Sleeping

App Files Files Community

vidtext_distil / app.py

tensorkelechi

Add Gemini API and Youtube functionality

9d2b048 verified 10 months ago

raw

history blame

3.52 kB

	import streamlit as st
	from transformers import pipeline
	from pytube import YouTube
	from pydub import AudioSegment
	from audio_extract import extract_audio
	import google.generativeai as google_genai
	import os
	from dotenv import load_dotenv

	load_dotenv()

	GOOGLE_API_KEY = os.getenv("GOOGLE_API_KEY")
	google_genai.configure(api_key=GOOGLE_API_KEY)

	st.set_page_config(
	page_title="VidText"
	)

	def youtube_video_downloader(url):
	yt_vid = YouTube(url)
	title = yt_vid.title
	vid_dld = (
	yt_vid.streams.filter(progressive=True, file_extension="mp4")
	.order_by("resolution")
	.desc()
	.first()
	)
	# vid_dld = vid_dld.download()
	return vid_dld, title


	def audio_extraction(video_file, output_format):
	# temp_filename = video_file.name
	# video_path = f"{temp_filename}"
	audio = extract_audio(
	input_path=video_file, output_path=f"{video_file[:-4]}.mp3", output_format=f"{output_format}"
	)
	return audio


	def audio_processing(mp3_audio):
	audio = AudioSegment.from_file(mp3_audio, format="mp3")
	wav_file = "audio_file.wav"
	audio = audio.export(wav_file, format="wav")
	return wav_file


	@st.cache_resource
	def transcribe_video(processed_audio):
	transcriber_model = pipeline(task="automatic-speech-recognition", model="openai/whisper-large-v3")
	text_extract = transcriber_model(processed_audio)
	return text_extract['text']

	def generate_ai_summary(transcript):
	model = google_genai.GenerativeModel('gemini-pro')
	model_response = model.generate_content([f"Give a summary of the text {transcript}"], stream=True)
	return model_response.text
	# Streamlit UI

	youtube_url_tab, file_select_tab, audio_file_tab = st.tabs(
	["Youtube url", "Video file", "Audio file"]
	)

	with youtube_url_tab:
	url = st.text_input("Enter the Youtube url")
	yt_video, title = youtube_video_downloader(url)
	if yt_video:
	if st.button("Transcribe"):
	with st.spinner("Transcribing..."):
	ytvideo_transcript = transcribe_video(yt_video)
	st.success(f"Transcription successful")
	st.write(ytvideo_transcript)
	if st.button("Generate Summary"):
	summary = generate_ai_summary(ytvideo_transcript)
	st.write(summary)


	# Video file transcription
	with file_select_tab:
	video_file = st.file_uploader("Upload video file", type="mp4")


	if video_file:
	if st.button("Transcribe"):
	with st.spinner("Transcribing..."):
	audio = audio_extraction(video_file, "mp3")
	video_transcript = transcribe_video(audio)
	st.success(f"Transcription successful")
	st.write(video_transcript)
	if st.button("Generate Summary"):
	summary = generate_ai_summary(video_transcript)
	st.write(summary)


	# Audio transcription
	with audio_file_tab:
	audio_file = st.file_uploader("Upload audio file", type="mp3")

	if audio_file:
	if st.button("Transcribe"):
	with st.spinner("Transcribing..."):
	processed_audio = audio_processing(audio_file)
	audio_transcript = transcribe_video(processed_audio)
	st.success(f"Transcription successful")
	st.write(audio_transcript)


	if st.button("Generate Summary"):
	summary = generate_ai_summary(audio_transcript)
	st.write(summary)