Spaces:

aletrn
/

ai-pronunciation-trainer

Running

App Files Files Community

alessandro trinca tornidor commited on 30 days ago

Commit

6957865

•

1 Parent(s): ab57dda

feat: added text-to-speech in browser, updated e2e playwright test cases

Browse files

Files changed (7) hide show

app.py +48 -7
static/tests/test-app-7860-example-medium0-upload-de.spec.ts +2 -2
static/tests/test-app-7860-example-medium0-upload-en.spec.ts +1 -1
static/tests/test-app-7860-random-upload-de.spec.ts +1 -1
static/tests/test-app-7860-random-upload-en.spec.ts +1 -1
static/tests/test-app-7860-upload-de.spec.ts +1 -1
static/tests/test-app-7860-upload-en.spec.ts +1 -1

app.py CHANGED Viewed

@@ -10,6 +10,46 @@ css = """
 .speech-output-container {align-items: center; min-height: 60px; padding-left: 8px; padding-right: 8px; margin-top: -12px; border-width: 1px; border-style: solid; border-color: lightgrey;}
 """
 def clear():
     return None
@@ -53,12 +93,12 @@ with gr.Blocks(css=css) as gradio_app:
                         value="Hi there, how are you?",
                     )
             with gr.Row():
-                with gr.Column(scale=7, min_width=240):
-                    audio_tts = gr.Audio(label="Audio TTS")
-                with gr.Column(scale=1, min_width=50):
-                    btn_run_tts = gr.Button(value="Run TTS")
-                    btn_clear_tts = gr.Button(value="Clear TTS")
-                    btn_clear_tts.click(clear, inputs=[], outputs=[audio_tts])
             with gr.Row():
                 audio_learner_recording_stt = gr.Audio(
                     label="Learner Recording",
@@ -156,7 +196,8 @@ with gr.Blocks(css=css) as gradio_app:
             number_score_de, number_score_en
         ],
     )
-    btn_run_tts.click(
         fn=lambdaTTS.get_tts,
         inputs=[text_learner_transcription, radio_language],
         outputs=audio_tts,

 .speech-output-container {align-items: center; min-height: 60px; padding-left: 8px; padding-right: 8px; margin-top: -12px; border-width: 1px; border-style: solid; border-color: lightgrey;}
 """
+js_play_audio = """
+function playAudio(text, language) {
+    let voice_idx = 0;
+    let voice_synth = null;
+    let synth = window.speechSynthesis;
+    function setSpeech() {
+        return new Promise(
+            function (resolve, reject) {
+                let id;
+                id = setInterval(() => {
+                    if (synth.getVoices().length !== 0) {
+                        resolve(synth.getVoices());
+                        clearInterval(id);
+                    }
+                }, 10);
+            }
+        )
+    }
+    let s = setSpeech();
+    s.then((voices) => {
+        for (idx = 0; idx < voices.length; idx++) {
+            if (voices[idx].lang.slice(0, 2) == language) {
+                voice_synth = voices[idx];
+                break;
+            }
+        }
+        var utterThis = new SpeechSynthesisUtterance(text);
+        utterThis.voice = voice_synth;
+        utterThis.rate = 0.7;
+        synth.speak(utterThis);
+        return utterThis;
+    });
+}
+"""
 def clear():
     return None
                         value="Hi there, how are you?",
                     )
             with gr.Row():
+                audio_tts = gr.Audio(label="Audio TTS")
+            with gr.Row():
+                btn_run_tts = gr.Button(value="TTS in browser")
+                btn_run_tts_backend = gr.Button(value="TTS backend")
+                btn_clear_tts = gr.Button(value="Clear TTS backend")
+                btn_clear_tts.click(clear, inputs=[], outputs=[audio_tts])
             with gr.Row():
                 audio_learner_recording_stt = gr.Audio(
                     label="Learner Recording",
             number_score_de, number_score_en
         ],
     )
+    btn_run_tts.click(fn=None, inputs=[text_learner_transcription, radio_language], outputs=audio_tts, js=js_play_audio)
+    btn_run_tts_backend.click(
         fn=lambdaTTS.get_tts,
         inputs=[text_learner_transcription, radio_language],
         outputs=audio_tts,

static/tests/test-app-7860-example-medium0-upload-de.spec.ts CHANGED Viewed

@@ -21,8 +21,8 @@ test("test: get a phonetic accuracy evaluation from an uploaded audio file.", as
   accordionExamples.click();
   const exampleMediumFirst = page.getByRole('gridcell', { name: 'medium' }).first();
   await exampleMediumFirst.click();
-  await page.getByRole('button', { name: 'Run TTS' }).click();
   const buttonPlay = page.getByLabel('Play', { exact: true })
   await buttonPlay.click();
   const waveFormTTS = page.locator('.scroll > .wrapper').first();

   accordionExamples.click();
   const exampleMediumFirst = page.getByRole('gridcell', { name: 'medium' }).first();
   await exampleMediumFirst.click();
+  await page.getByRole('button', { name: 'TTS backend', exact: true }).click();
   const buttonPlay = page.getByLabel('Play', { exact: true })
   await buttonPlay.click();
   const waveFormTTS = page.locator('.scroll > .wrapper').first();

static/tests/test-app-7860-example-medium0-upload-en.spec.ts CHANGED Viewed

@@ -22,7 +22,7 @@ test("test: get a phonetic accuracy evaluation from an uploaded audio file.", as
   const exampleMediumFirst = page.getByRole('gridcell', { name: 'medium' }).nth(1);
   await exampleMediumFirst.click();
-  await page.getByRole('button', { name: 'Run TTS' }).click();
   const buttonPlay = page.getByLabel('Play', { exact: true })
   await buttonPlay.click();
   const waveFormTTS = page.locator('.scroll > .wrapper').first();

   const exampleMediumFirst = page.getByRole('gridcell', { name: 'medium' }).nth(1);
   await exampleMediumFirst.click();
+  await page.getByRole('button', { name: 'TTS backend', exact: true }).click();
   const buttonPlay = page.getByLabel('Play', { exact: true })
   await buttonPlay.click();
   const waveFormTTS = page.locator('.scroll > .wrapper').first();

static/tests/test-app-7860-random-upload-de.spec.ts CHANGED Viewed

@@ -34,7 +34,7 @@ test("test: get a phonetic accuracy evaluation from an uploaded audio file.", as
     learnerTranscriptionScreenshot1.toString('base64')
   )
-  await page.getByRole('button', { name: 'Run TTS' }).click();
   const buttonPlay = page.getByLabel('Play', { exact: true })
   await buttonPlay.click();
   const waveFormTTS = page.locator('.scroll > .wrapper').first();

     learnerTranscriptionScreenshot1.toString('base64')
   )
+  await page.getByRole('button', { name: 'TTS backend', exact: true }).click();
   const buttonPlay = page.getByLabel('Play', { exact: true })
   await buttonPlay.click();
   const waveFormTTS = page.locator('.scroll > .wrapper').first();

static/tests/test-app-7860-random-upload-en.spec.ts CHANGED Viewed

@@ -34,7 +34,7 @@ test("test: get a phonetic accuracy evaluation from an uploaded audio file.", as
     learnerTranscriptionScreenshot1.toString('base64')
   )
-  await page.getByRole('button', { name: 'Run TTS' }).click();
   const buttonPlay = page.getByLabel('Play', { exact: true })
   await buttonPlay.click();
   const waveFormTTS = page.locator('.scroll > .wrapper').first();

     learnerTranscriptionScreenshot1.toString('base64')
   )
+  await page.getByRole('button', { name: 'TTS backend', exact: true }).click();
   const buttonPlay = page.getByLabel('Play', { exact: true })
   await buttonPlay.click();
   const waveFormTTS = page.locator('.scroll > .wrapper').first();

static/tests/test-app-7860-upload-de.spec.ts CHANGED Viewed

@@ -23,7 +23,7 @@ test("test: get a phonetic accuracy evaluation from an uploaded audio file.", as
   const textboxLearnerTranscriptionInput = page.getByLabel('Learner Transcription')
   await textboxLearnerTranscriptionInput.fill('Ich bin Alex, wer bist du?');
-  await page.getByRole('button', { name: 'Run TTS' }).click();
   const buttonPlay = page.getByLabel('Play', { exact: true })
   await buttonPlay.click();
   const waveFormTTS = page.locator('.scroll > .wrapper').first();

   const textboxLearnerTranscriptionInput = page.getByLabel('Learner Transcription')
   await textboxLearnerTranscriptionInput.fill('Ich bin Alex, wer bist du?');
+  await page.getByRole('button', { name: 'TTS backend', exact: true }).click();
   const buttonPlay = page.getByLabel('Play', { exact: true })
   await buttonPlay.click();
   const waveFormTTS = page.locator('.scroll > .wrapper').first();

static/tests/test-app-7860-upload-en.spec.ts CHANGED Viewed

@@ -16,7 +16,7 @@ test("test: get a phonetic accuracy evaluation from an uploaded audio file.", as
   const page = await browser.newPage({});
   await page.goto('http://localhost:7860/');
-  await page.getByRole('button', { name: 'Run TTS' }).click();
   const buttonPlay = page.getByLabel('Play', { exact: true })
   await buttonPlay.click();
   const waveFormTTS = page.locator('.scroll > .wrapper').first();

   const page = await browser.newPage({});
   await page.goto('http://localhost:7860/');
+  await page.getByRole('button', { name: 'TTS backend', exact: true }).click();
   const buttonPlay = page.getByLabel('Play', { exact: true })
   await buttonPlay.click();
   const waveFormTTS = page.locator('.scroll > .wrapper').first();