Spaces:

JBHF
/

VERTAAL-APP-EAGLE-SHELTER

Running

App Files Files Community

JBHF commited on Apr 16

Commit

9462d67

•

1 Parent(s): 845d0e9

Update app-16-04-2024-14u00m-CET.py

Browse files

Files changed (1) hide show

app-16-04-2024-14u00m-CET.py +23 -6

app-16-04-2024-14u00m-CET.py CHANGED Viewed

@@ -67,6 +67,9 @@ import streamlit as st
 # князем Данилом Романовичем біля Звенигорода і названий на честь його сина Лева Сьогодні Львів має площу 155 квадратних кілометрів з безліччю громадських будинків, кафе, магазинів
 # ...
 # TEXTS FROM UKRAIN TO TRANSLATE:
 # 1 - Short text from https://youtu.be/1_vO60OkkrY?list=PLeeQI3aTmCn9Lu9mgSCmmc-KkGI95-Ie6 :
 text_to_transcribe = """князем Данилом Романовичем біля Звенигорода і названий на честь його сина Лева Сьогодні Львів має площу 155 квадратних кілометрів з безліччю громадських будинків, кафе, магазинів"""
@@ -167,6 +170,17 @@ st.write(response.content)
 import streamlit as st
 from audiorecorder import audiorecorder
 st.title("Audio Recorder")
 # audiorecorder(start_prompt="Start recording", stop_prompt="Stop recording", pause_prompt="", key=None):
 audio = audiorecorder("Click to record", "Click to stop recording", "Click to pause recording")
@@ -209,6 +223,8 @@ st.button("Rerun")
 # infer_faster_whisper_large_v2 (CPU VERSIE !) 08-04-2024-COLAB-CPU-PYTHON3-tvscitechtalk.ipynb
 # https://colab.research.google.com/drive/1EreiFx825oIrR2P43XSXjHXx01EWi6ZH#scrollTo=vuLjbPxexPDj&uniqifier=5
 from faster_whisper import WhisperModel
 model_size = "large-v2"
@@ -225,15 +241,17 @@ model_size = "large-v2"
 # JB: Dit gebruikt mijn HF Token !
 # st.write("Ready Loading the WhisperModel: model = WhisperModel(model_size, device=\"cpu\")")
-st.write("Loading the WhisperModel: model = WhisperModel(model_size, device=\"cpu\", compute_type=\"int8\")")
 model = WhisperModel(model_size, device="cpu", compute_type="int8") # , compute_type="float16") # JB
 # JB: Dit gebruikt mijn HF Token !
 # st.write("Ready Loading the WhisperModel: model = WhisperModel(model_size, device=\"cpu\")")
 # LOADING OF model = WhisperModel(model_size, device="cpu") TAKES ABOUT 1 MINUTE ON HF SPACES STREAMLIT FREE TIER
 #
-st.write("Ready Loading the WhisperModel: model = WhisperModel(model_size, device=\"cpu\", compute_type=\"int8\")")
 # LOADING OF model = WhisperModel(model_size, device=\"cpu\", compute_type=\"int8\") TAKES ABOUT 33 sec (Na RERUN 1 minute) ON HF SPACES STREAMLIT FREE TIER
 # USING:
 # model = WhisperModel(model_size, device="cpu", compute_type="int8") # JB
@@ -248,8 +266,8 @@ segments, info = model.transcribe("audio.wav", beam_size=1) # DIT WERKT: GEDUREN
 # print("Detected language '%s' with probability %f" % (info.language, info.language_probability))
 st.write("Detected language '%s' with probability %f" % (info.language, info.language_probability))
 st.write("")
-st.write("info.all_language_probs     : ", info.all_language_probs)
-st.write("len(info.all_language_probs): ", len(info.all_language_probs))
 # 99
 st.write("")
@@ -264,7 +282,6 @@ st.write("info.duration: ", info.duration)
 # seconds = info.duration - minutes*60
 minutes = int(info.duration / 60)
 seconds = info.duration - minutes*60
 st.write(minutes," minutes and ", seconds, " seconds")

 # князем Данилом Романовичем біля Звенигорода і названий на честь його сина Лева Сьогодні Львів має площу 155 квадратних кілометрів з безліччю громадських будинків, кафе, магазинів
 # ...
+st.header("Voorbeeld van het vertalen van een tekst in het Oekraïens naar het Nederlands:", divider='rainbow')
 # TEXTS FROM UKRAIN TO TRANSLATE:
 # 1 - Short text from https://youtu.be/1_vO60OkkrY?list=PLeeQI3aTmCn9Lu9mgSCmmc-KkGI95-Ie6 :
 text_to_transcribe = """князем Данилом Романовичем біля Звенигорода і названий на честь його сина Лева Сьогодні Львів має площу 155 квадратних кілометрів з безліччю громадських будинків, кафе, магазинів"""
 import streamlit as st
 from audiorecorder import audiorecorder
+st.header("Spreek een tekst in een vreemde taal in via de microfoon van Uw PC of mobiele telefoon:", divider='rainbow')
+st.write("Klik eerst     op \"Click to record\" om de opname te starten.")
+st.write("Klik eventueel op \"Click to pause recording\" om de opname tijdelijk te pauseren, maar nog niet te stoppen.")
+st.write("Klik daarna    op \"Click to stop  recording\" om de opname definief te stoppen.")
+st.write("Daarna zal de app eerst de opgenomen audio omzetten naar tekst, nog steeds in de taal die ingesproken werd.")
+st.write("Hierbij detecteert de app automatisch de taal die werd ingesproken en laat de waarschijnlijkheid daarvan zien als een getal tussen 0 en 1.")
+st.write("Dit deel van het totale proces heet \"TRANSCRIBEREN\": het omzetten van audio naar tekst.")
 st.title("Audio Recorder")
 # audiorecorder(start_prompt="Start recording", stop_prompt="Stop recording", pause_prompt="", key=None):
 audio = audiorecorder("Click to record", "Click to stop recording", "Click to pause recording")
 # infer_faster_whisper_large_v2 (CPU VERSIE !) 08-04-2024-COLAB-CPU-PYTHON3-tvscitechtalk.ipynb
 # https://colab.research.google.com/drive/1EreiFx825oIrR2P43XSXjHXx01EWi6ZH#scrollTo=vuLjbPxexPDj&uniqifier=5
+st.header("Nu gaat de app de ingesproken tekst daadwerkelijk vertalen naar het Nederlands:", divider='rainbow')
 from faster_whisper import WhisperModel
 model_size = "large-v2"
 # JB: Dit gebruikt mijn HF Token !
 # st.write("Ready Loading the WhisperModel: model = WhisperModel(model_size, device=\"cpu\")")
+# st.write("Loading the WhisperModel: model = WhisperModel(model_size, device=\"cpu\", compute_type=\"int8\")")
+st.write("Laden van het vertaal model")
 model = WhisperModel(model_size, device="cpu", compute_type="int8") # , compute_type="float16") # JB
 # JB: Dit gebruikt mijn HF Token !
 # st.write("Ready Loading the WhisperModel: model = WhisperModel(model_size, device=\"cpu\")")
 # LOADING OF model = WhisperModel(model_size, device="cpu") TAKES ABOUT 1 MINUTE ON HF SPACES STREAMLIT FREE TIER
 #
+# st.write("Ready Loading the WhisperModel: model = WhisperModel(model_size, device=\"cpu\", compute_type=\"int8\")")
 # LOADING OF model = WhisperModel(model_size, device=\"cpu\", compute_type=\"int8\") TAKES ABOUT 33 sec (Na RERUN 1 minute) ON HF SPACES STREAMLIT FREE TIER
+st.write("Klaar met het laden van het vertaal model")
 # USING:
 # model = WhisperModel(model_size, device="cpu", compute_type="int8") # JB
 # print("Detected language '%s' with probability %f" % (info.language, info.language_probability))
 st.write("Detected language '%s' with probability %f" % (info.language, info.language_probability))
 st.write("")
+# st.write("info.all_language_probs     : ", info.all_language_probs)
+# st.write("len(info.all_language_probs): ", len(info.all_language_probs))
 # 99
 st.write("")
 # seconds = info.duration - minutes*60
 minutes = int(info.duration / 60)
 seconds = info.duration - minutes*60
 st.write(minutes," minutes and ", seconds, " seconds")