Spaces:
Running
Running
Update app-16-04-2024-14u00m-CET.py
Browse files- app-16-04-2024-14u00m-CET.py +23 -6
app-16-04-2024-14u00m-CET.py
CHANGED
@@ -67,6 +67,9 @@ import streamlit as st
|
|
67 |
# князем Данилом Романовичем біля Звенигорода і названий на честь його сина Лева Сьогодні Львів має площу 155 квадратних кілометрів з безліччю громадських будинків, кафе, магазинів
|
68 |
# ...
|
69 |
|
|
|
|
|
|
|
70 |
# TEXTS FROM UKRAIN TO TRANSLATE:
|
71 |
# 1 - Short text from https://youtu.be/1_vO60OkkrY?list=PLeeQI3aTmCn9Lu9mgSCmmc-KkGI95-Ie6 :
|
72 |
text_to_transcribe = """князем Данилом Романовичем біля Звенигорода і названий на честь його сина Лева Сьогодні Львів має площу 155 квадратних кілометрів з безліччю громадських будинків, кафе, магазинів"""
|
@@ -167,6 +170,17 @@ st.write(response.content)
|
|
167 |
import streamlit as st
|
168 |
from audiorecorder import audiorecorder
|
169 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
170 |
st.title("Audio Recorder")
|
171 |
# audiorecorder(start_prompt="Start recording", stop_prompt="Stop recording", pause_prompt="", key=None):
|
172 |
audio = audiorecorder("Click to record", "Click to stop recording", "Click to pause recording")
|
@@ -209,6 +223,8 @@ st.button("Rerun")
|
|
209 |
# infer_faster_whisper_large_v2 (CPU VERSIE !) 08-04-2024-COLAB-CPU-PYTHON3-tvscitechtalk.ipynb
|
210 |
# https://colab.research.google.com/drive/1EreiFx825oIrR2P43XSXjHXx01EWi6ZH#scrollTo=vuLjbPxexPDj&uniqifier=5
|
211 |
|
|
|
|
|
212 |
from faster_whisper import WhisperModel
|
213 |
|
214 |
model_size = "large-v2"
|
@@ -225,15 +241,17 @@ model_size = "large-v2"
|
|
225 |
# JB: Dit gebruikt mijn HF Token !
|
226 |
# st.write("Ready Loading the WhisperModel: model = WhisperModel(model_size, device=\"cpu\")")
|
227 |
|
228 |
-
st.write("Loading the WhisperModel: model = WhisperModel(model_size, device=\"cpu\", compute_type=\"int8\")")
|
|
|
|
|
229 |
model = WhisperModel(model_size, device="cpu", compute_type="int8") # , compute_type="float16") # JB
|
230 |
# JB: Dit gebruikt mijn HF Token !
|
231 |
# st.write("Ready Loading the WhisperModel: model = WhisperModel(model_size, device=\"cpu\")")
|
232 |
# LOADING OF model = WhisperModel(model_size, device="cpu") TAKES ABOUT 1 MINUTE ON HF SPACES STREAMLIT FREE TIER
|
233 |
#
|
234 |
-
st.write("Ready Loading the WhisperModel: model = WhisperModel(model_size, device=\"cpu\", compute_type=\"int8\")")
|
235 |
# LOADING OF model = WhisperModel(model_size, device=\"cpu\", compute_type=\"int8\") TAKES ABOUT 33 sec (Na RERUN 1 minute) ON HF SPACES STREAMLIT FREE TIER
|
236 |
-
|
237 |
|
238 |
# USING:
|
239 |
# model = WhisperModel(model_size, device="cpu", compute_type="int8") # JB
|
@@ -248,8 +266,8 @@ segments, info = model.transcribe("audio.wav", beam_size=1) # DIT WERKT: GEDUREN
|
|
248 |
# print("Detected language '%s' with probability %f" % (info.language, info.language_probability))
|
249 |
st.write("Detected language '%s' with probability %f" % (info.language, info.language_probability))
|
250 |
st.write("")
|
251 |
-
st.write("info.all_language_probs : ", info.all_language_probs)
|
252 |
-
st.write("len(info.all_language_probs): ", len(info.all_language_probs))
|
253 |
# 99
|
254 |
|
255 |
st.write("")
|
@@ -264,7 +282,6 @@ st.write("info.duration: ", info.duration)
|
|
264 |
# seconds = info.duration - minutes*60
|
265 |
minutes = int(info.duration / 60)
|
266 |
seconds = info.duration - minutes*60
|
267 |
-
|
268 |
st.write(minutes," minutes and ", seconds, " seconds")
|
269 |
|
270 |
|
|
|
67 |
# князем Данилом Романовичем біля Звенигорода і названий на честь його сина Лева Сьогодні Львів має площу 155 квадратних кілометрів з безліччю громадських будинків, кафе, магазинів
|
68 |
# ...
|
69 |
|
70 |
+
st.header("Voorbeeld van het vertalen van een tekst in het Oekraïens naar het Nederlands:", divider='rainbow')
|
71 |
+
|
72 |
+
|
73 |
# TEXTS FROM UKRAIN TO TRANSLATE:
|
74 |
# 1 - Short text from https://youtu.be/1_vO60OkkrY?list=PLeeQI3aTmCn9Lu9mgSCmmc-KkGI95-Ie6 :
|
75 |
text_to_transcribe = """князем Данилом Романовичем біля Звенигорода і названий на честь його сина Лева Сьогодні Львів має площу 155 квадратних кілометрів з безліччю громадських будинків, кафе, магазинів"""
|
|
|
170 |
import streamlit as st
|
171 |
from audiorecorder import audiorecorder
|
172 |
|
173 |
+
st.header("Spreek een tekst in een vreemde taal in via de microfoon van Uw PC of mobiele telefoon:", divider='rainbow')
|
174 |
+
st.write("Klik eerst op \"Click to record\" om de opname te starten.")
|
175 |
+
st.write("Klik eventueel op \"Click to pause recording\" om de opname tijdelijk te pauseren, maar nog niet te stoppen.")
|
176 |
+
st.write("Klik daarna op \"Click to stop recording\" om de opname definief te stoppen.")
|
177 |
+
|
178 |
+
st.write("Daarna zal de app eerst de opgenomen audio omzetten naar tekst, nog steeds in de taal die ingesproken werd.")
|
179 |
+
st.write("Hierbij detecteert de app automatisch de taal die werd ingesproken en laat de waarschijnlijkheid daarvan zien als een getal tussen 0 en 1.")
|
180 |
+
|
181 |
+
st.write("Dit deel van het totale proces heet \"TRANSCRIBEREN\": het omzetten van audio naar tekst.")
|
182 |
+
|
183 |
+
|
184 |
st.title("Audio Recorder")
|
185 |
# audiorecorder(start_prompt="Start recording", stop_prompt="Stop recording", pause_prompt="", key=None):
|
186 |
audio = audiorecorder("Click to record", "Click to stop recording", "Click to pause recording")
|
|
|
223 |
# infer_faster_whisper_large_v2 (CPU VERSIE !) 08-04-2024-COLAB-CPU-PYTHON3-tvscitechtalk.ipynb
|
224 |
# https://colab.research.google.com/drive/1EreiFx825oIrR2P43XSXjHXx01EWi6ZH#scrollTo=vuLjbPxexPDj&uniqifier=5
|
225 |
|
226 |
+
st.header("Nu gaat de app de ingesproken tekst daadwerkelijk vertalen naar het Nederlands:", divider='rainbow')
|
227 |
+
|
228 |
from faster_whisper import WhisperModel
|
229 |
|
230 |
model_size = "large-v2"
|
|
|
241 |
# JB: Dit gebruikt mijn HF Token !
|
242 |
# st.write("Ready Loading the WhisperModel: model = WhisperModel(model_size, device=\"cpu\")")
|
243 |
|
244 |
+
# st.write("Loading the WhisperModel: model = WhisperModel(model_size, device=\"cpu\", compute_type=\"int8\")")
|
245 |
+
st.write("Laden van het vertaal model")
|
246 |
+
|
247 |
model = WhisperModel(model_size, device="cpu", compute_type="int8") # , compute_type="float16") # JB
|
248 |
# JB: Dit gebruikt mijn HF Token !
|
249 |
# st.write("Ready Loading the WhisperModel: model = WhisperModel(model_size, device=\"cpu\")")
|
250 |
# LOADING OF model = WhisperModel(model_size, device="cpu") TAKES ABOUT 1 MINUTE ON HF SPACES STREAMLIT FREE TIER
|
251 |
#
|
252 |
+
# st.write("Ready Loading the WhisperModel: model = WhisperModel(model_size, device=\"cpu\", compute_type=\"int8\")")
|
253 |
# LOADING OF model = WhisperModel(model_size, device=\"cpu\", compute_type=\"int8\") TAKES ABOUT 33 sec (Na RERUN 1 minute) ON HF SPACES STREAMLIT FREE TIER
|
254 |
+
st.write("Klaar met het laden van het vertaal model")
|
255 |
|
256 |
# USING:
|
257 |
# model = WhisperModel(model_size, device="cpu", compute_type="int8") # JB
|
|
|
266 |
# print("Detected language '%s' with probability %f" % (info.language, info.language_probability))
|
267 |
st.write("Detected language '%s' with probability %f" % (info.language, info.language_probability))
|
268 |
st.write("")
|
269 |
+
# st.write("info.all_language_probs : ", info.all_language_probs)
|
270 |
+
# st.write("len(info.all_language_probs): ", len(info.all_language_probs))
|
271 |
# 99
|
272 |
|
273 |
st.write("")
|
|
|
282 |
# seconds = info.duration - minutes*60
|
283 |
minutes = int(info.duration / 60)
|
284 |
seconds = info.duration - minutes*60
|
|
|
285 |
st.write(minutes," minutes and ", seconds, " seconds")
|
286 |
|
287 |
|