JBHF commited on
Commit
9462d67
1 Parent(s): 845d0e9

Update app-16-04-2024-14u00m-CET.py

Browse files
Files changed (1) hide show
  1. app-16-04-2024-14u00m-CET.py +23 -6
app-16-04-2024-14u00m-CET.py CHANGED
@@ -67,6 +67,9 @@ import streamlit as st
67
  # князем Данилом Романовичем біля Звенигорода і названий на честь його сина Лева Сьогодні Львів має площу 155 квадратних кілометрів з безліччю громадських будинків, кафе, магазинів
68
  # ...
69
 
 
 
 
70
  # TEXTS FROM UKRAIN TO TRANSLATE:
71
  # 1 - Short text from https://youtu.be/1_vO60OkkrY?list=PLeeQI3aTmCn9Lu9mgSCmmc-KkGI95-Ie6 :
72
  text_to_transcribe = """князем Данилом Романовичем біля Звенигорода і названий на честь його сина Лева Сьогодні Львів має площу 155 квадратних кілометрів з безліччю громадських будинків, кафе, магазинів"""
@@ -167,6 +170,17 @@ st.write(response.content)
167
  import streamlit as st
168
  from audiorecorder import audiorecorder
169
 
 
 
 
 
 
 
 
 
 
 
 
170
  st.title("Audio Recorder")
171
  # audiorecorder(start_prompt="Start recording", stop_prompt="Stop recording", pause_prompt="", key=None):
172
  audio = audiorecorder("Click to record", "Click to stop recording", "Click to pause recording")
@@ -209,6 +223,8 @@ st.button("Rerun")
209
  # infer_faster_whisper_large_v2 (CPU VERSIE !) 08-04-2024-COLAB-CPU-PYTHON3-tvscitechtalk.ipynb
210
  # https://colab.research.google.com/drive/1EreiFx825oIrR2P43XSXjHXx01EWi6ZH#scrollTo=vuLjbPxexPDj&uniqifier=5
211
 
 
 
212
  from faster_whisper import WhisperModel
213
 
214
  model_size = "large-v2"
@@ -225,15 +241,17 @@ model_size = "large-v2"
225
  # JB: Dit gebruikt mijn HF Token !
226
  # st.write("Ready Loading the WhisperModel: model = WhisperModel(model_size, device=\"cpu\")")
227
 
228
- st.write("Loading the WhisperModel: model = WhisperModel(model_size, device=\"cpu\", compute_type=\"int8\")")
 
 
229
  model = WhisperModel(model_size, device="cpu", compute_type="int8") # , compute_type="float16") # JB
230
  # JB: Dit gebruikt mijn HF Token !
231
  # st.write("Ready Loading the WhisperModel: model = WhisperModel(model_size, device=\"cpu\")")
232
  # LOADING OF model = WhisperModel(model_size, device="cpu") TAKES ABOUT 1 MINUTE ON HF SPACES STREAMLIT FREE TIER
233
  #
234
- st.write("Ready Loading the WhisperModel: model = WhisperModel(model_size, device=\"cpu\", compute_type=\"int8\")")
235
  # LOADING OF model = WhisperModel(model_size, device=\"cpu\", compute_type=\"int8\") TAKES ABOUT 33 sec (Na RERUN 1 minute) ON HF SPACES STREAMLIT FREE TIER
236
-
237
 
238
  # USING:
239
  # model = WhisperModel(model_size, device="cpu", compute_type="int8") # JB
@@ -248,8 +266,8 @@ segments, info = model.transcribe("audio.wav", beam_size=1) # DIT WERKT: GEDUREN
248
  # print("Detected language '%s' with probability %f" % (info.language, info.language_probability))
249
  st.write("Detected language '%s' with probability %f" % (info.language, info.language_probability))
250
  st.write("")
251
- st.write("info.all_language_probs : ", info.all_language_probs)
252
- st.write("len(info.all_language_probs): ", len(info.all_language_probs))
253
  # 99
254
 
255
  st.write("")
@@ -264,7 +282,6 @@ st.write("info.duration: ", info.duration)
264
  # seconds = info.duration - minutes*60
265
  minutes = int(info.duration / 60)
266
  seconds = info.duration - minutes*60
267
-
268
  st.write(minutes," minutes and ", seconds, " seconds")
269
 
270
 
 
67
  # князем Данилом Романовичем біля Звенигорода і названий на честь його сина Лева Сьогодні Львів має площу 155 квадратних кілометрів з безліччю громадських будинків, кафе, магазинів
68
  # ...
69
 
70
+ st.header("Voorbeeld van het vertalen van een tekst in het Oekraïens naar het Nederlands:", divider='rainbow')
71
+
72
+
73
  # TEXTS FROM UKRAIN TO TRANSLATE:
74
  # 1 - Short text from https://youtu.be/1_vO60OkkrY?list=PLeeQI3aTmCn9Lu9mgSCmmc-KkGI95-Ie6 :
75
  text_to_transcribe = """князем Данилом Романовичем біля Звенигорода і названий на честь його сина Лева Сьогодні Львів має площу 155 квадратних кілометрів з безліччю громадських будинків, кафе, магазинів"""
 
170
  import streamlit as st
171
  from audiorecorder import audiorecorder
172
 
173
+ st.header("Spreek een tekst in een vreemde taal in via de microfoon van Uw PC of mobiele telefoon:", divider='rainbow')
174
+ st.write("Klik eerst op \"Click to record\" om de opname te starten.")
175
+ st.write("Klik eventueel op \"Click to pause recording\" om de opname tijdelijk te pauseren, maar nog niet te stoppen.")
176
+ st.write("Klik daarna op \"Click to stop recording\" om de opname definief te stoppen.")
177
+
178
+ st.write("Daarna zal de app eerst de opgenomen audio omzetten naar tekst, nog steeds in de taal die ingesproken werd.")
179
+ st.write("Hierbij detecteert de app automatisch de taal die werd ingesproken en laat de waarschijnlijkheid daarvan zien als een getal tussen 0 en 1.")
180
+
181
+ st.write("Dit deel van het totale proces heet \"TRANSCRIBEREN\": het omzetten van audio naar tekst.")
182
+
183
+
184
  st.title("Audio Recorder")
185
  # audiorecorder(start_prompt="Start recording", stop_prompt="Stop recording", pause_prompt="", key=None):
186
  audio = audiorecorder("Click to record", "Click to stop recording", "Click to pause recording")
 
223
  # infer_faster_whisper_large_v2 (CPU VERSIE !) 08-04-2024-COLAB-CPU-PYTHON3-tvscitechtalk.ipynb
224
  # https://colab.research.google.com/drive/1EreiFx825oIrR2P43XSXjHXx01EWi6ZH#scrollTo=vuLjbPxexPDj&uniqifier=5
225
 
226
+ st.header("Nu gaat de app de ingesproken tekst daadwerkelijk vertalen naar het Nederlands:", divider='rainbow')
227
+
228
  from faster_whisper import WhisperModel
229
 
230
  model_size = "large-v2"
 
241
  # JB: Dit gebruikt mijn HF Token !
242
  # st.write("Ready Loading the WhisperModel: model = WhisperModel(model_size, device=\"cpu\")")
243
 
244
+ # st.write("Loading the WhisperModel: model = WhisperModel(model_size, device=\"cpu\", compute_type=\"int8\")")
245
+ st.write("Laden van het vertaal model")
246
+
247
  model = WhisperModel(model_size, device="cpu", compute_type="int8") # , compute_type="float16") # JB
248
  # JB: Dit gebruikt mijn HF Token !
249
  # st.write("Ready Loading the WhisperModel: model = WhisperModel(model_size, device=\"cpu\")")
250
  # LOADING OF model = WhisperModel(model_size, device="cpu") TAKES ABOUT 1 MINUTE ON HF SPACES STREAMLIT FREE TIER
251
  #
252
+ # st.write("Ready Loading the WhisperModel: model = WhisperModel(model_size, device=\"cpu\", compute_type=\"int8\")")
253
  # LOADING OF model = WhisperModel(model_size, device=\"cpu\", compute_type=\"int8\") TAKES ABOUT 33 sec (Na RERUN 1 minute) ON HF SPACES STREAMLIT FREE TIER
254
+ st.write("Klaar met het laden van het vertaal model")
255
 
256
  # USING:
257
  # model = WhisperModel(model_size, device="cpu", compute_type="int8") # JB
 
266
  # print("Detected language '%s' with probability %f" % (info.language, info.language_probability))
267
  st.write("Detected language '%s' with probability %f" % (info.language, info.language_probability))
268
  st.write("")
269
+ # st.write("info.all_language_probs : ", info.all_language_probs)
270
+ # st.write("len(info.all_language_probs): ", len(info.all_language_probs))
271
  # 99
272
 
273
  st.write("")
 
282
  # seconds = info.duration - minutes*60
283
  minutes = int(info.duration / 60)
284
  seconds = info.duration - minutes*60
 
285
  st.write(minutes," minutes and ", seconds, " seconds")
286
 
287