Spaces:

aletrn
/

ai-pronunciation-trainer

Running

App Files Files Community

alessandro trinca tornidor commited on Nov 23, 2024

Commit

ca7e6be

1 Parent(s): 0931910

feat: add global score component by language

Browse files

Files changed (2) hide show

aip_trainer/lambdas/lambdaSpeechToScore.py +2 -2
app.py +35 -5

aip_trainer/lambdas/lambdaSpeechToScore.py CHANGED Viewed

@@ -126,12 +126,12 @@ def get_speech_to_score_dict(real_text: str, file_bytes_or_audiotmpfile: str | d
     duration = time.time() - start
     duration_tot = time.time() - start0
     app_logger.info(f'Time to post-process results: {duration}, tot_duration:{duration_tot}.')
-    pronunciation_accuracy = str(int(result['pronunciation_accuracy']))
     ipa_transcript = result['recording_ipa']
     return {'real_transcript': result['recording_transcript'],
            'ipa_transcript': ipa_transcript,
-           'pronunciation_accuracy': pronunciation_accuracy,
            'real_transcripts': real_transcripts, 'matched_transcripts': matched_transcripts,
            'real_transcripts_ipa': real_transcripts_ipa, 'matched_transcripts_ipa': matched_transcripts_ipa,
            'pair_accuracy_category': pair_accuracy_category,

     duration = time.time() - start
     duration_tot = time.time() - start0
     app_logger.info(f'Time to post-process results: {duration}, tot_duration:{duration_tot}.')
+    pronunciation_accuracy = float(result['pronunciation_accuracy'])
     ipa_transcript = result['recording_ipa']
     return {'real_transcript': result['recording_transcript'],
            'ipa_transcript': ipa_transcript,
+           'pronunciation_accuracy': float(f"{pronunciation_accuracy:.2f}"),
            'real_transcripts': real_transcripts, 'matched_transcripts': matched_transcripts,
            'real_transcripts_ipa': real_transcripts_ipa, 'matched_transcripts_ipa': matched_transcripts_ipa,
            'pair_accuracy_category': pair_accuracy_category,

app.py CHANGED Viewed

@@ -1,3 +1,4 @@
 from pathlib import Path
 import gradio as gr
@@ -20,6 +21,9 @@ with gr.Blocks() as gradio_app:
     with open(project_root_folder / "aip_trainer" / "lambdas" / "app_description.md", "r", encoding="utf-8") as app_description_src:
         app_description = app_description_src.read()
         gr.Markdown(app_description)
     with gr.Row():
         with gr.Column(scale=4, min_width=300):
             with gr.Row():
@@ -81,9 +85,7 @@ with gr.Blocks() as gradio_app:
                 label="Letters correctness",
                 visible=False,
             )
-            pronunciation_accuracy = gr.Textbox(
-                lines=1, placeholder=None, label="Pronunciation accuracy %"
-            )
             recording_ipa = gr.Textbox(
                 lines=1, placeholder=None, label="Learner phonetic transcription"
             )
@@ -102,9 +104,36 @@ with gr.Blocks() as gradio_app:
             )
             with gr.Row():
                 btn = gr.Button(value="Recognize speech accuracy")
     btn.click(
-        lambdaSpeechToScore.get_speech_to_score_tuple,
-        inputs=[learner_transcription, audio_learner_recording_stt, language],
         outputs=[
             transcripted_text,
             letter_correctness,
@@ -112,6 +141,7 @@ with gr.Blocks() as gradio_app:
             recording_ipa,
             ideal_ipa,
             res,
         ],
     )
     btn_run_tts.click(

+import json
 from pathlib import Path
 import gradio as gr
     with open(project_root_folder / "aip_trainer" / "lambdas" / "app_description.md", "r", encoding="utf-8") as app_description_src:
         app_description = app_description_src.read()
         gr.Markdown(app_description)
+    with gr.Row():
+        number_score_de = gr.Number(label="Score DE", value=0.0)
+        number_score_en = gr.Number(label="Score EN", value=0.0)
     with gr.Row():
         with gr.Column(scale=4, min_width=300):
             with gr.Row():
                 label="Letters correctness",
                 visible=False,
             )
+            pronunciation_accuracy = gr.Number(label="Pronunciation accuracy %")
             recording_ipa = gr.Textbox(
                 lines=1, placeholder=None, label="Learner phonetic transcription"
             )
             )
             with gr.Row():
                 btn = gr.Button(value="Recognize speech accuracy")
+    def get_updated_score_by_language(text: str, audio_rec: str | Path, lang: str, score_de: float, score_en: float):
+        _transcripted_text, _letter_correctness, _pronunciation_accuracy, _recording_ipa, _ideal_ipa, _res = lambdaSpeechToScore.get_speech_to_score_tuple(text, audio_rec, lang)
+        output = {
+            transcripted_text: _transcripted_text,
+            letter_correctness: _letter_correctness,
+            pronunciation_accuracy: _pronunciation_accuracy,
+            recording_ipa: _recording_ipa,
+            ideal_ipa: _ideal_ipa,
+            res: _res,
+        }
+        match lang:
+            case "de":
+                return {
+                    number_score_de: float(score_de) + float(_pronunciation_accuracy),
+                    number_score_en: float(score_en),
+                    **output
+                }
+            case "en":
+                return {
+                    number_score_en: float(score_en) + float(_pronunciation_accuracy),
+                    number_score_de: float(score_de),
+                    **output
+                }
+            case _:
+                raise NotImplementedError(f"Language {lang} not supported")
     btn.click(
+        get_updated_score_by_language,
+        inputs=[learner_transcription, audio_learner_recording_stt, language, number_score_de, number_score_en],
         outputs=[
             transcripted_text,
             letter_correctness,
             recording_ipa,
             ideal_ipa,
             res,
+            number_score_de, number_score_en
         ],
     )
     btn_run_tts.click(