w-t-p-01

Sleeping

App Files Files Community

hivecorp commited on Nov 19, 2024

Commit

835e081

verified ·

1 Parent(s): 8154937

Update app.py

Browse files

Files changed (1) hide show

app.py +465 -159

app.py CHANGED Viewed

@@ -1,145 +1,28 @@
-import gradio as gr
-from pydub import AudioSegment
-import edge_tts
-import os
-import asyncio
-import uuid
-import re
-# Function to get the length of an audio file in milliseconds
-def get_audio_length(audio_file):
-    audio = AudioSegment.from_file(audio_file)
-    return len(audio) / 1000  # Return in seconds for compatibility
-# Function to format time for SRT in milliseconds
-def format_time_ms(milliseconds):
-    seconds, ms = divmod(int(milliseconds), 1000)
-    mins, secs = divmod(seconds, 60)
-    hrs, mins = divmod(mins, 60)
-    return f"{hrs:02}:{mins:02}:{secs:02},{ms:03}"
-# Function to split text into segments based on punctuation, ensuring no word is split
-def split_text_into_segments(text):
-    segments = []
-    raw_segments = re.split(r'([.!?,])', text)
-    for i in range(0, len(raw_segments) - 1, 2):
-        sentence = raw_segments[i].strip() + raw_segments[i + 1]
-        words = sentence.split()
-        if len(words) <= 8:
-            segments.append(sentence.strip())
-        else:
-            chunk = ""
-            for word in words:
-                if len(chunk.split()) < 8:
-                    chunk += " " + word
-                else:
-                    segments.append(chunk.strip())
-                    chunk = word
-            if chunk:
-                segments.append(chunk.strip())
-    if len(raw_segments) % 2 == 1:
-        remaining_text = raw_segments[-1].strip()
-        if remaining_text:
-            segments.append(remaining_text)
-    return segments
-# Function to generate SRT with millisecond accuracy per batch
-async def generate_accurate_srt(batch_text, batch_num, start_offset, pitch, rate, voice):
-    audio_file = f"batch_{batch_num}_audio.wav"
-    tts = edge_tts.Communicate(batch_text, voice, rate=rate, pitch=pitch)
-    await tts.save(audio_file)
-    actual_length = get_audio_length(audio_file) * 1000  # Convert to milliseconds
-    segments = split_text_into_segments(batch_text)
-    segment_duration = actual_length / len(segments)
-    start_time = start_offset
-    srt_content = ""
-    for index, segment in enumerate(segments):
-        end_time = start_time + segment_duration
-        if end_time > start_offset + actual_length:
-            end_time = start_offset + actual_length
-        srt_content += f"{index + 1 + (batch_num * 100)}\n"
-        srt_content += f"{format_time_ms(start_time)} --> {format_time_ms(end_time)}\n"
-        srt_content += segment + "\n\n"
-        start_time = end_time
-    return srt_content, audio_file, start_time
-# Batch processing function with millisecond accuracy
-async def batch_process_srt_and_audio(script_text, pitch, rate, voice, progress=gr.Progress()):
-    batches = [script_text[i:i + 500] for i in range(0, len(script_text), 500)]
-    all_srt_content = ""
-    combined_audio = AudioSegment.empty()
-    start_offset = 0.0
-    for batch_num, batch_text in enumerate(batches):
-        srt_content, audio_file, end_offset = await generate_accurate_srt(batch_text, batch_num, start_offset, pitch, rate, voice)
-        all_srt_content += srt_content
-        batch_audio = AudioSegment.from_file(audio_file)
-        combined_audio += batch_audio
-        start_offset = end_offset
-        os.remove(audio_file)
-        progress((batch_num + 1) / len(batches))
-    total_audio_length = combined_audio.duration_seconds
-    validated_srt_content = ""
-    for line in all_srt_content.strip().splitlines():
-        if '-->' in line:
-            start_str, end_str = line.split(' --> ')
-            start_time = sum(x * float(t) for x, t in zip([3600, 60, 1, 0.001], start_str.replace(',', ':').split(':')))
-            end_time = sum(x * float(t) for x, t in zip([3600, 60, 1, 0.001], end_str.replace(',', ':').split(':')))
-            if end_time > total_audio_length:
-                end_time = total_audio_length
-            line = f"{format_time_ms(start_time * 1000)} --> {format_time_ms(end_time * 1000)}"
-        validated_srt_content += line + "\n"
-    unique_id = uuid.uuid4()
-    final_audio_path = f"final_audio_{unique_id}.mp3"
-    final_srt_path = f"final_subtitles_{unique_id}.srt"
-    combined_audio.export(final_audio_path, format="mp3", bitrate="320k")
-    with open(final_srt_path, "w") as srt_file:
-        srt_file.write(validated_srt_content)
-    return final_srt_path, final_audio_path
-# Gradio interface function
-async def process_script(script_text, pitch, rate, voice):
-    pitch_str = f"{pitch}Hz" if pitch != 0 else "-1Hz"
-    formatted_rate = f"{'+' if rate > 1 else ''}{int(rate)}%"
-    srt_path, audio_path = await batch_process_srt_and_audio(script_text, pitch_str, formatted_rate, voice_options[voice])
-    return srt_path, audio_path, audio_path
-# Gradio interface setup
-voice_options = {
-    "Andrew Male": "en-US-AndrewNeural",
-    "Jenny Female": "en-US-JennyNeural",
-    "Guy Male": "en-US-GuyNeural",
-    "Ana Female": "en-US-AnaNeural",
-    "Aria Female": "en-US-AriaNeural",
-    "Brian Male": "en-US-BrianNeural",
-    "Christopher Male": "en-US-ChristopherNeural",
-    "Eric Male": "en-US-EricNeural",
-    "Michelle Male": "en-US-MichelleNeural",
-    "Roger Male": "en-US-RogerNeural",
-    "Natasha Female": "en-AU-NatashaNeural",
-    "William Male": "en-AU-WilliamNeural",
-    "Clara Female": "en-CA-ClaraNeural",
-    "Liam Female ": "en-CA-LiamNeural",
-    "Libby Female": "en-GB-LibbyNeural",
     "Maisie": "en-GB-MaisieNeural",
     "Ryan": "en-GB-RyanNeural",
     "Sonia": "en-GB-SoniaNeural",
@@ -163,25 +46,448 @@ voice_options = {
     "Imani": "en-TZ-ImaniNeural",
     "Leah": "en-ZA-LeahNeural",
     "Luke": "en-ZA-LukeNeural"
-    # Add other voices here...
 }
-app = gr.Interface(
-    fn=process_script,
-    inputs=[
-        gr.Textbox(label="Enter Script Text", lines=10),
-        gr.Slider(label="Pitch Adjustment (Hz)", minimum=-20, maximum=20, value=0, step=1),
-        gr.Slider(label="Rate Adjustment (%)", minimum=-50, maximum=50, value=-1, step=1),
-        gr.Dropdown(label="Select Voice", choices=list(voice_options.keys()), value="Andrew Male"),
-    ],
-    outputs=[
-        gr.File(label="Download SRT File"),
-        gr.File(label="Download Audio File"),
-        gr.Audio(label="Audio Playback")
-    ],
-    title="WritooAI Pro Text-to-Speech with Subtitle",
-    description="Convert your script into Audio with Auto generated Subtitles.",
-    theme="compact",
-)
-app.launch()

+import tempfile
+import edge_tts
+import gradio as gr
+language_dict = {
+    "Hindi": {
+    "Madhur": "hi-IN-MadhurNeural",
+    "Swara": "hi-IN-SwaraNeural"
+  },
+  "English": {
+    "Jenny": "en-US-JennyNeural",
+    "Guy": "en-US-GuyNeural",
+    "Ana": "en-US-AnaNeural",
+    "Aria": "en-US-AriaNeural",
+    "Brian": "en-US-BrianNeural",
+    "Christopher": "en-US-ChristopherNeural",
+    "Eric": "en-US-EricNeural",
+    "Michelle": "en-US-MichelleNeural",
+    "Roger": "en-US-RogerNeural",
+    "Natasha": "en-AU-NatashaNeural",
+    "William": "en-AU-WilliamNeural",
+    "Clara": "en-CA-ClaraNeural",
+    "Liam": "en-CA-LiamNeural",
+    "Libby": "en-GB-LibbyNeural",
     "Maisie": "en-GB-MaisieNeural",
     "Ryan": "en-GB-RyanNeural",
     "Sonia": "en-GB-SoniaNeural",
     "Imani": "en-TZ-ImaniNeural",
     "Leah": "en-ZA-LeahNeural",
     "Luke": "en-ZA-LukeNeural"
+  },
+  "Spanish": {
+    "Elena": "es-AR-ElenaNeural",
+    "Tomas": "es-AR-TomasNeural",
+    "Marcelo": "es-BO-MarceloNeural",
+    "Sofia": "es-BO-SofiaNeural",
+    "Gonzalo": "es-CO-GonzaloNeural",
+    "Salome": "es-CO-SalomeNeural",
+    "Juan": "es-CR-JuanNeural",
+    "Maria": "es-CR-MariaNeural",
+    "Belkys": "es-CU-BelkysNeural",
+    "Emilio": "es-DO-EmilioNeural",
+    "Ramona": "es-DO-RamonaNeural",
+    "Andrea": "es-EC-AndreaNeural",
+    "Luis": "es-EC-LuisNeural",
+    "Alvaro": "es-ES-AlvaroNeural",
+    "Elvira": "es-ES-ElviraNeural",
+    "Teresa": "es-GQ-TeresaNeural",
+    "Andres": "es-GT-AndresNeural",
+    "Marta": "es-GT-MartaNeural",
+    "Carlos": "es-HN-CarlosNeural",
+    "Karla": "es-HN-KarlaNeural",
+    "Federico": "es-NI-FedericoNeural",
+    "Yolanda": "es-NI-YolandaNeural",
+    "Margarita": "es-PA-MargaritaNeural",
+    "Roberto": "es-PA-RobertoNeural",
+    "Alex": "es-PE-AlexNeural",
+    "Camila": "es-PE-CamilaNeural",
+    "Karina": "es-PR-KarinaNeural",
+    "Victor": "es-PR-VictorNeural",
+    "Mario": "es-PY-MarioNeural",
+    "Tania": "es-PY-TaniaNeural",
+    "Lorena": "es-SV-LorenaNeural",
+    "Rodrigo": "es-SV-RodrigoNeural",
+    "Alonso": "es-US-AlonsoNeural",
+    "Paloma": "es-US-PalomaNeural",
+    "Mateo": "es-UY-MateoNeural",
+    "Valentina": "es-UY-ValentinaNeural",
+    "Paola": "es-VE-PaolaNeural",
+    "Sebastian": "es-VE-SebastianNeural"
+  },
+  "Arabic": {
+    "Hamed": "ar-SA-HamedNeural",
+    "Zariyah": "ar-SA-ZariyahNeural",
+    "Fatima": "ar-AE-FatimaNeural",
+    "Hamdan": "ar-AE-HamdanNeural",
+    "Ali": "ar-BH-AliNeural",
+    "Laila": "ar-BH-LailaNeural",
+    "Ismael": "ar-DZ-IsmaelNeural",
+    "Salma": "ar-EG-SalmaNeural",
+    "Shakir": "ar-EG-ShakirNeural",
+    "Bassel": "ar-IQ-BasselNeural",
+    "Rana": "ar-IQ-RanaNeural",
+    "Sana": "ar-JO-SanaNeural",
+    "Taim": "ar-JO-TaimNeural",
+    "Fahed": "ar-KW-FahedNeural",
+    "Noura": "ar-KW-NouraNeural",
+    "Layla": "ar-LB-LaylaNeural",
+    "Rami": "ar-LB-RamiNeural",
+    "Iman": "ar-LY-ImanNeural",
+    "Omar": "ar-LY-OmarNeural",
+    "Jamal": "ar-MA-JamalNeural",
+    "Mouna": "ar-MA-MounaNeural",
+    "Abdullah": "ar-OM-AbdullahNeural",
+    "Aysha": "ar-OM-AyshaNeural",
+    "Amal": "ar-QA-AmalNeural",
+    "Moaz": "ar-QA-MoazNeural",
+    "Amany": "ar-SY-AmanyNeural",
+    "Laith": "ar-SY-LaithNeural",
+    "Hedi": "ar-TN-HediNeural",
+    "Reem": "ar-TN-ReemNeural",
+    "Maryam": "ar-YE-MaryamNeural",
+    "Saleh": "ar-YE-SalehNeural"
+  },
+  "Korean": {
+    "Sun-Hi": "ko-KR-SunHiNeural",
+    "InJoon": "ko-KR-InJoonNeural"
+  },
+  "Thai": {
+    "Premwadee": "th-TH-PremwadeeNeural",
+    "Niwat": "th-TH-NiwatNeural"
+  },
+  "Vietnamese": {
+    "HoaiMy": "vi-VN-HoaiMyNeural",
+    "NamMinh": "vi-VN-NamMinhNeural"
+  },
+  "Japanese": {
+    "Nanami": "ja-JP-NanamiNeural",
+    "Keita": "ja-JP-KeitaNeural"
+  },
+  "French": {
+    "Denise": "fr-FR-DeniseNeural",
+    "Eloise": "fr-FR-EloiseNeural",
+    "Henri": "fr-FR-HenriNeural",
+    "Sylvie": "fr-CA-SylvieNeural",
+    "Antoine": "fr-CA-AntoineNeural",
+    "Jean": "fr-CA-JeanNeural",
+    "Ariane": "fr-CH-ArianeNeural",
+    "Fabrice": "fr-CH-FabriceNeural",
+    "Charline": "fr-BE-CharlineNeural",
+    "Gerard": "fr-BE-GerardNeural"
+  },
+  "Portuguese": {
+    "Francisca": "pt-BR-FranciscaNeural",
+    "Antonio": "pt-BR-AntonioNeural",
+    "Duarte": "pt-PT-DuarteNeural",
+    "Raquel": "pt-PT-RaquelNeural"
+  },
+  "Indonesian": {
+    "Ardi": "id-ID-ArdiNeural",
+    "Gadis": "id-ID-GadisNeural"
+  },
+  "Hebrew": {
+    "Avri": "he-IL-AvriNeural",
+    "Hila": "he-IL-HilaNeural"
+  },
+  "Italian": {
+    "Isabella": "it-IT-IsabellaNeural",
+    "Diego": "it-IT-DiegoNeural",
+    "Elsa": "it-IT-ElsaNeural"
+  },
+  "Dutch": {
+    "Colette": "nl-NL-ColetteNeural",
+    "Fenna": "nl-NL-FennaNeural",
+    "Maarten": "nl-NL-MaartenNeural",
+    "Arnaud": "nl-BE-ArnaudNeural",
+    "Dena": "nl-BE-DenaNeural"
+  },
+  "Malay": {
+    "Osman": "ms-MY-OsmanNeural",
+    "Yasmin": "ms-MY-YasminNeural"
+  },
+  "Norwegian": {
+    "Pernille": "nb-NO-PernilleNeural",
+    "Finn": "nb-NO-FinnNeural"
+  },
+  "Swedish": {
+    "Sofie": "sv-SE-SofieNeural",
+    "Mattias": "sv-SE-MattiasNeural"
+  },
+  "Greek": {
+    "Athina": "el-GR-AthinaNeural",
+    "Nestoras": "el-GR-NestorasNeural"
+  },
+  "German": {
+    "Katja": "de-DE-KatjaNeural",
+    "Amala": "de-DE-AmalaNeural",
+    "Conrad": "de-DE-ConradNeural",
+    "Killian": "de-DE-KillianNeural",
+    "Ingrid": "de-AT-IngridNeural",
+    "Jonas": "de-AT-JonasNeural",
+    "Jan": "de-CH-JanNeural",
+    "Leni": "de-CH-LeniNeural"
+  },
+  "Afrikaans": {
+    "Adri": "af-ZA-AdriNeural",
+    "Willem": "af-ZA-WillemNeural"
+  },
+  "Amharic": {
+    "Ameha": "am-ET-AmehaNeural",
+    "Mekdes": "am-ET-MekdesNeural"
+  },
+  "Azerbaijani": {
+    "Babek": "az-AZ-BabekNeural",
+    "Banu": "az-AZ-BanuNeural"
+  },
+  "Bulgarian": {
+    "Borislav": "bg-BG-BorislavNeural",
+    "Kalina": "bg-BG-KalinaNeural"
+  },
+  "Bengali": {
+    "Nabanita": "bn-BD-NabanitaNeural",
+    "Pradeep": "bn-BD-PradeepNeural",
+    "Bashkar": "bn-IN-BashkarNeural",
+    "Tanishaa": "bn-IN-TanishaaNeural"
+  },
+  "Bosnian": {
+    "Goran": "bs-BA-GoranNeural",
+    "Vesna": "bs-BA-VesnaNeural"
+  },
+  "Catalan": {
+    "Joana": "ca-ES-JoanaNeural",
+    "Enric": "ca-ES-EnricNeural"
+  },
+  "Czech": {
+    "Antonin": "cs-CZ-AntoninNeural",
+    "Vlasta": "cs-CZ-VlastaNeural"
+  },
+  "Welsh": {
+    "Aled": "cy-GB-AledNeural",
+    "Nia": "cy-GB-NiaNeural"
+  },
+  "Danish": {
+    "Christel": "da-DK-ChristelNeural",
+    "Jeppe": "da-DK-JeppeNeural"
+  },
+  "Estonian": {
+    "Anu": "et-EE-AnuNeural",
+    "Kert": "et-EE-KertNeural"
+  },
+  "Persian": {
+    "Dilara": "fa-IR-DilaraNeural",
+    "Farid": "fa-IR-FaridNeural"
+  },
+  "Finnish": {
+    "Harri": "fi-FI-HarriNeural",
+    "Noora": "fi-FI-NooraNeural"
+  },
+  "Irish": {
+    "Colm": "ga-IE-ColmNeural",
+    "Orla": "ga-IE-OrlaNeural"
+  },
+  "Galician": {
+    "Roi": "gl-ES-RoiNeural",
+    "Sabela": "gl-ES-SabelaNeural"
+  },
+  "Gujarati": {
+    "Dhwani": "gu-IN-DhwaniNeural",
+    "Niranjan": "gu-IN-NiranjanNeural"
+  },
+  "Croatian": {
+    "Gabrijela": "hr-HR-GabrijelaNeural",
+    "Srecko": "hr-HR-SreckoNeural"
+  },
+  "Hungarian": {
+    "Noemi": "hu-HU-NoemiNeural",
+    "Tamas": "hu-HU-TamasNeural"
+  },
+  "Icelandic": {
+    "Gudrun": "is-IS-GudrunNeural",
+    "Gunnar": "is-IS-GunnarNeural"
+  },
+  "Javanese": {
+    "Dimas": "jv-ID-DimasNeural",
+    "Siti": "jv-ID-SitiNeural"
+  },
+  "Georgian": {
+    "Eka": "ka-GE-EkaNeural",
+    "Giorgi": "ka-GE-GiorgiNeural"
+  },
+  "Kazakh": {
+    "Aigul": "kk-KZ-AigulNeural",
+    "Daulet": "kk-KZ-DauletNeural"
+  },
+  "Khmer": {
+    "Piseth": "km-KH-PisethNeural",
+    "Sreymom": "km-KH-SreymomNeural"
+  },
+  "Kannada": {
+    "Gagan": "kn-IN-GaganNeural",
+    "Sapna": "kn-IN-SapnaNeural"
+  },
+  "Lao": {
+    "Chanthavong": "lo-LA-ChanthavongNeural",
+    "Keomany": "lo-LA-KeomanyNeural"
+  },
+  "Lithuanian": {
+    "Leonas": "lt-LT-LeonasNeural",
+    "Ona": "lt-LT-OnaNeural"
+  },
+  "Latvian": {
+    "Everita": "lv-LV-EveritaNeural",
+    "Nils": "lv-LV-NilsNeural"
+  },
+  "Macedonian": {
+    "Aleksandar": "mk-MK-AleksandarNeural",
+    "Marija": "mk-MK-MarijaNeural"
+  },
+  "Malayalam": {
+    "Midhun": "ml-IN-MidhunNeural",
+    "Sobhana": "ml-IN-SobhanaNeural"
+  },
+  "Mongolian": {
+    "Bataa": "mn-MN-BataaNeural",
+    "Yesui": "mn-MN-YesuiNeural"
+  },
+  "Marathi": {
+    "Aarohi": "mr-IN-AarohiNeural",
+    "Manohar": "mr-IN-ManoharNeural"
+  },
+  "Maltese": {
+    "Grace": "mt-MT-GraceNeural",
+    "Joseph": "mt-MT-JosephNeural"
+  },
+  "Burmese": {
+    "Nilar": "my-MM-NilarNeural",
+    "Thiha": "my-MM-ThihaNeural"
+  },
+  "Nepali": {
+    "Hemkala": "ne-NP-HemkalaNeural",
+    "Sagar": "ne-NP-SagarNeural"
+  },
+  "Polish": {
+    "Marek": "pl-PL-MarekNeural",
+    "Zofia": "pl-PL-ZofiaNeural"
+  },
+  "Pashto": {
+    "Gul Nawaz": "ps-AF-GulNawazNeural",
+    "Latifa": "ps-AF-LatifaNeural"
+  },
+  "Romanian": {
+    "Alina": "ro-RO-AlinaNeural",
+    "Emil": "ro-RO-EmilNeural"
+  },
+  "Russian": {
+    "Svetlana": "ru-RU-SvetlanaNeural",
+    "Dmitry": "ru-RU-DmitryNeural"
+  },
+  "Sinhala": {
+    "Sameera": "si-LK-SameeraNeural",
+    "Thilini": "si-LK-ThiliniNeural"
+  },
+  "Slovak": {
+    "Lukas": "sk-SK-LukasNeural",
+    "Viktoria": "sk-SK-ViktoriaNeural"
+  },
+  "Slovenian": {
+    "Petra": "sl-SI-PetraNeural",
+    "Rok": "sl-SI-RokNeural"
+  },
+  "Somali": {
+    "Muuse": "so-SO-MuuseNeural",
+    "Ubax": "so-SO-UbaxNeural"
+  },
+  "Albanian": {
+    "Anila": "sq-AL-AnilaNeural",
+    "Ilir": "sq-AL-IlirNeural"
+  },
+  "Serbian": {
+    "Nicholas": "sr-RS-NicholasNeural",
+    "Sophie": "sr-RS-SophieNeural"
+  },
+  "Sundanese": {
+    "Jajang": "su-ID-JajangNeural",
+    "Tuti": "su-ID-TutiNeural"
+  },
+  "Swahili": {
+    "Rafiki": "sw-KE-RafikiNeural",
+    "Zuri": "sw-KE-ZuriNeural",
+    "Daudi": "sw-TZ-DaudiNeural",
+    "Rehema": "sw-TZ-RehemaNeural"
+    },
+  "Tamil": {
+    "Pallavi": "ta-IN-PallaviNeural",
+    "Valluvar": "ta-IN-ValluvarNeural",
+    "Kumar": "ta-LK-KumarNeural",
+    "Saranya": "ta-LK-SaranyaNeural",
+    "Kani": "ta-MY-KaniNeural",
+    "Surya": "ta-MY-SuryaNeural",
+    "Anbu": "ta-SG-AnbuNeural"
+  },
+  "Telugu": {
+    "Mohan": "te-IN-MohanNeural",
+    "Shruti": "te-IN-ShrutiNeural"
+  },
+  "Turkish": {
+    "Ahmet": "tr-TR-AhmetNeural",
+    "Emel": "tr-TR-EmelNeural"
+  },
+  "Ukrainian": {
+    "Ostap": "uk-UA-OstapNeural",
+    "Polina": "uk-UA-PolinaNeural"
+  },
+  "Urdu": {
+    "Gul": "ur-IN-GulNeural",
+    "Salman": "ur-IN-SalmanNeural",
+    "Asad": "ur-PK-AsadNeural",
+    "Uzma": "ur-PK-UzmaNeural"
+  },
+  "Uzbek": {
+    "Madina": "uz-UZ-MadinaNeural",
+    "Sardor": "uz-UZ-SardorNeural"
+  },
+  "Mandarin": {
+    "Xiaoxiao": "zh-CN-XiaoxiaoNeural",
+    "Yunyang": "zh-CN-YunyangNeural",
+    "Yunxi": "zh-CN-YunxiNeural",
+    "Xiaoyi": "zh-CN-XiaoyiNeural",
+    "Yunjian": "zh-CN-YunjianNeural",
+    "Yunxia": "zh-CN-YunxiaNeural",
+    "Xiaobei": "zh-CN-liaoning-XiaobeiNeural",
+    "Xiaoni": "zh-CN-shaanxi-XiaoniNeural",
+    "HiuMaan": "zh-HK-HiuMaanNeural",
+    "HiuGaai": "zh-HK-HiuGaaiNeural",
+    "WanLung": "zh-HK-WanLungNeural",
+    "HsiaoChen": "zh-TW-HsiaoChenNeural",
+    "HsiaoYu": "zh-TW-HsiaoYuNeural",
+    "YunJhe": "zh-TW-YunJheNeural"
+  },
+  "Zulu": {
+    "Thando": "zu-ZA-ThandoNeural",
+    "Themba": "zu-ZA-ThembaNeural"
+  }
 }
+async def text_to_speech_edge(text, language_code, speaker, tashkeel_checkbox=False):
+    # Define the character limit
+    char_limit = 100000000
+    if len(text) > char_limit:
+        return f"Error: Use 150,000 Words at a time. ", None
+    # Get the voice for the selected language and speaker
+    voice = language_dict[language_code][speaker]
+    communicate = edge_tts.Communicate(text, voice)
+    with tempfile.NamedTemporaryFile(delete=False, suffix=".mp3") as tmp_file:
+        tmp_path = tmp_file.name
+        await communicate.save(tmp_path)
+    return text, tmp_path
+def get_speakers(language):
+    print(language)
+    speakers = list(language_dict[language].keys())
+    return gr.Dropdown(choices=speakers, value=speakers[0], interactive=True), gr.Checkbox(visible=language == "Arabic", interactive=True)
+default_language = None
+default_speaker = None
+with gr.Blocks(title="Writoo AI V2") as demo:
+    gr.HTML(" ")
+    gr.HTML(f"<h3 style='color:Tomato;'🎶 Exciting News: 10 More Voice Added 🎶 </h3>")
+    gr.Markdown("✨ Features: • Convert text to speech in seconds 😍")
+    with gr.Row():
+        with gr.Column():
+            input_text = gr.Textbox(lines=5, label="Input Text", placeholder="Enter text to convert to speech")
+            language = gr.Dropdown(
+                choices=list(language_dict.keys()), value=default_language, label="Languages", interactive=True
+            )
+            speaker = gr.Dropdown(choices=[], value=default_speaker, label="Speakers", interactive=False)
+            tashkeel_checkbox = gr.Checkbox(label="Tashkeel", value=False, visible=False, interactive=False)
+            run_btn = gr.Button(value="Generate Audio", variant="primary")
+        with gr.Column():
+            output_text = gr.Textbox(label="Output Text")
+            output_audio = gr.Audio(type="filepath", label="Audio Output")
+    language.change(get_speakers, inputs=[language], outputs=[speaker, tashkeel_checkbox])
+    run_btn.click(text_to_speech_edge, inputs=[input_text, language, speaker, tashkeel_checkbox], outputs=[output_text, output_audio])
+if __name__ == "__main__":
+    demo.queue().launch(share=False)