Spaces:

thewh1teagle
/

tts-with-israwave

Running

App Files Files Community

thewh1teagle commited on Sep 14, 2024

Commit

47d86bc

1 Parent(s): 55838b8

init

Browse files

Files changed (5) hide show

.gitattributes +2 -1
app.py +66 -0
israwave.onnx +3 -0
nakdimon.onnx +3 -0
requirements.txt +2 -0

.gitattributes CHANGED Viewed

@@ -13,7 +13,6 @@
 *.msgpack filter=lfs diff=lfs merge=lfs -text
 *.npy filter=lfs diff=lfs merge=lfs -text
 *.npz filter=lfs diff=lfs merge=lfs -text
-*.onnx filter=lfs diff=lfs merge=lfs -text
 *.ot filter=lfs diff=lfs merge=lfs -text
 *.parquet filter=lfs diff=lfs merge=lfs -text
 *.pb filter=lfs diff=lfs merge=lfs -text
@@ -33,3 +32,5 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.msgpack filter=lfs diff=lfs merge=lfs -text
 *.npy filter=lfs diff=lfs merge=lfs -text
 *.npz filter=lfs diff=lfs merge=lfs -text
 *.ot filter=lfs diff=lfs merge=lfs -text
 *.parquet filter=lfs diff=lfs merge=lfs -text
 *.pb filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+espeak-ng-data/ filter=lfs diff=lfs merge=lfs -text

app.py ADDED Viewed

	@@ -0,0 +1,66 @@

+"""
+pip install -r requirements.txt
+wget https://github.com/thewh1teagle/israwave/releases/download/v0.1.0/israwave.onnx
+wget https://github.com/thewh1teagle/israwave/releases/download/v0.1.0/nakdimon.onnx
+wget https://github.com/thewh1teagle/israwave/releases/download/v0.1.0/espeak-ng-data.tar.gz
+tar xf espeak-ng-data.tar.gz
+python3 app.py
+"""
+import gradio as gr
+from israwave import IsraWave
+from nakdimon_ort import Nakdimon
+from israwave.segment import SegmentExtractor
+import numpy as np
+import soundfile as sf
+import io
+segment_extractor = SegmentExtractor()
+speech_model = IsraWave('israwave.onnx', 'espeak-ng-data')
+niqqud_model = Nakdimon('nakdimon.onnx')
+def create_audio(text: str, rate, pitch, energy):
+    text = niqqud_model.compute(text)
+    waveforms = []
+    for segment in segment_extractor.extract_segments(text):
+        waveform = speech_model.create(segment.text, rate=rate, pitch=pitch, energy=energy)
+        waveforms.append(waveform.samples)
+        silence = segment.create_pause(waveform.sample_rate)
+        waveforms.append(silence)
+    return np.concatenate(waveforms), speech_model.sample_rate
+def create(text, rate, pitch, energy):
+    audio, sample_rate = create_audio(text, rate, pitch, energy)
+    # Convert numpy array to WAV format in memory using soundfile
+    with io.BytesIO() as buf:
+        sf.write(buf, audio, sample_rate, format='WAV')
+        buf.seek(0)
+        return buf.read()
+with gr.Blocks(theme=gr.themes.Soft()) as demo:
+    # Centered title
+    gr.Markdown("<h1 style='text-align: center;'>IsraWave</h1>")
+    # Use Textarea with RTL direction
+    text = gr.TextArea(label="text", lines=4, elem_id="rtl_textarea", value='זה כיף להזמין דברים באינטרנט, אבל הרבה פחות כיף לחכות ולחכות עד שהם יגיעו אלינו. אז מה בעצם עובר על החבילות בדרך הארוכה עד לבית שלנו? והאם אפשר לגרום לכך שהן יגיעו מהר יותר? ')
+    rate = gr.Slider(0.1, 10, label="rate", value=1.0)
+    pitch = gr.Slider(0.1, 10, label="pitch", value=1.0)
+    energy = gr.Slider(0.1, 10, label="energy", value=1.0)
+    button = gr.Button("Create", elem_id="create_button")
+    output = gr.Audio()
+    button.click(fn=create, inputs=[text, rate, pitch, energy], outputs=output)
+    # Custom CSS for RTL direction
+    demo.css = """
+    #rtl_textarea textarea {
+        direction: rtl;
+        font-size: 20px;
+    }
+    """
+demo.launch()

israwave.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b47686804d113c0fe37ec9d46b2039ab4fd26a9cda90eb9ebe9f971622207f4f
+size 71587050

nakdimon.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9ff491dcc7d66392019d427a98b97d5de10c0d721628ae740858174ae22b190e
+size 21312753

requirements.txt ADDED Viewed

	@@ -0,0 +1,2 @@


1	+ gradio
2	+ israwave