""" ████████╗████████╗███████╗ ╚══██╔══╝╚══██╔══╝██╔════╝ ██║ ██║ ███████╗ ██║ ██║ ╚════██║ ██║ ██║ ███████║ ╚═╝ ╚═╝ ╚══════╝ ██╗███╗ ██╗██████╗ ██████╗ ███╗ ██╗███████╗███████╗██╗ █████╗ ██╗ ██╗██╗ ██╗ ██║████╗ ██║██╔══██╗██╔═══██╗████╗ ██║██╔════╝██╔════╝██║██╔══██╗██║ ██╔╝██║ ██║ ██║██╔██╗ ██║██║ ██║██║ ██║██╔██╗ ██║█████╗ ███████╗██║███████║█████╔╝ ██║ ██║ ██║██║╚██╗██║██║ ██║██║ ██║██║╚██╗██║██╔══╝ ╚════██║██║██╔══██║██╔═██╗ ██║ ██║ ██║██║ ╚████║██████╔╝╚██████╔╝██║ ╚████║███████╗███████║██║██║ ██║██║ ██╗╚██████╔╝ ╚═╝╚═╝ ╚═══╝╚═════╝ ╚═════╝ ╚═╝ ╚═══╝╚══════╝╚══════╝╚═╝╚═╝ ╚═╝╚═╝ ╚═╝ ╚═════╝ Script ini dibuat oleh __drat Petunjuk: 1. Script ini digunakan untuk menghasilkan suara berbasis teks dengan berbagai pilihan pembicara. 2. Teknologi yang digunakan meliputi model text-to-speech (TTS) yang canggih dengan konversi teks ke fonem (G2P). 3. Model yang dipakai dilatih khusus untuk bahasa Indonesia, Jawa, dan Sunda. 4. Antarmuka dibuat dengan menggunakan Gradio dengan tema kustom bernama MetafisikTheme. Cara Menggunakan: 1. Masukkan teks yang ingin diubah menjadi suara. 2. Pilih kecepatan bicara yang diinginkan. 3. Pilih bahasa dan pembicara yang diinginkan. 4. Klik tombol "Lakukan Inferensi Audio" untuk menghasilkan suara. """ import gradio as gr import platform import json from pathlib import Path import uuid import html import subprocess import time from g2pid import G2P from themes import MetafisikTheme # Impor tema custom dari themes.py # Inisialisasi G2P (Grapheme to Phoneme) g2p = G2P() # Fungsi untuk mengecek apakah sistem operasi adalah macOS def is_mac_os(): return platform.system() == 'Darwin' # Parameter default untuk konfigurasi params = { "activate": True, "autoplay": True, "show_text": True, "remove_trailing_dots": False, "voice": "default.wav", "language": "Indonesian", "model_path": "checkpoint_1260000-inference.pth", "config_path": "config.json", "out_path": "output.wav" } SAMPLE_RATE = 16000 device = None # Set nama pembicara default default_speaker_name = "ardi" # Fungsi untuk mengubah teks menjadi urutan yang sesuai untuk model def text_to_sequence(text): # Implementasikan sesuai dengan kebutuhan model Anda # Sebagai contoh, ini adalah placeholder sequence = [ord(char) for char in text] return sequence # Fungsi untuk menghasilkan suara dengan progress bar def gen_voice(text, speaker_label, speed, language, progress=gr.Progress()): speaker_mapping = { "Wibowo - Suara jantan berwibawa": "wibowo", "Ardi - Suara lembut dan hangat": "ardi", "Gadis - Suara perempuan yang merdu": "gadis", "Juminten - Suara perempuan jawa (bahasa jawa)": "JV-00264", "Asep - Suara lelaki sunda (bahasa sunda)": "SU-00060" } speaker = speaker_mapping.get(speaker_label, default_speaker_name) progress(0, desc="Menginisialisasi G2P") text = html.unescape(text) text_to_tts = g2p(text) # Konversi teks ke format TTS menggunakan G2P time.sleep(1) progress(0.2, desc="Mengonversi teks ke TTS") short_uuid = str(uuid.uuid4())[:8] output_file = Path(f'outputs/{speaker}-{short_uuid}.wav') # Perintah untuk menjalankan TTS command = [ "tts", "--text", text_to_tts, "--model_path", params["model_path"], "--config_path", params["config_path"], "--speaker_idx", speaker, "--out_path", str(output_file) ] progress(0.5, desc="Menjalankan proses TTS") result = subprocess.run(command, capture_output=True, text=True) time.sleep(1) if result.returncode != 0: print(f"Error: {result.stderr}") return None progress(1, desc="Selesai") return str(output_file) # Fungsi untuk memperbarui daftar pembicara def update_speakers(): speakers = [ ("Wibowo - Suara jantan berwibawa", "wibowo"), ("Ardi - Suara lembut dan hangat", "ardi"), ("Gadis - Suara perempuan yang merdu", "gadis"), ("Juminten - Suara perempuan jawa (bahasa jawa)", "JV-00264"), ("Asep - Suara lelaki sunda (bahasa sunda)", "SU-00060") ] return speakers # Fungsi untuk memperbarui dropdown pembicara def update_dropdown(_=None, selected_speaker=default_speaker_name): choices = update_speakers() dropdown_choices = {label: label for label, value in choices} return gr.Dropdown(choices=dropdown_choices, value=selected_speaker, label="Pilih Pembicara", interactive=True, allow_custom_value=True) # Memuat data bahasa with open(Path('languages.json'), encoding='utf8') as f: languages = json.load(f) # Antarmuka Gradio dengan tema MetafisikTheme with gr.Blocks(theme=MetafisikTheme()) as app: gr.Markdown("### TTS Bahasa Indonesia", elem_id="main-title") with gr.Row(): with gr.Column(): text_input = gr.Textbox(lines=2, label="Teks", value="Halo, saya adalah pembicara virtual.", elem_id="text-input") speed_slider = gr.Slider(label='Kecepatan Bicara', minimum=0.1, maximum=1.99, value=0.8, step=0.01, elem_id="speed-slider") language_dropdown = gr.Dropdown(list(languages.keys()), label="Bahasa", value="Indonesian", elem_id="language-dropdown") submit_button = gr.Button("🗣️ Lakukan Inferensi Audio", elem_id="submit-button") explanation = gr.HTML("""
Aplikasi ini digunakan untuk menghasilkan suara berbasis teks dengan berbagai pilihan pembicara. Teknologi yang digunakan meliputi model text-to-speech (TTS) yang canggih dengan konversi teks ke fonem. Model yang dipakai dilatih khusus untuk bahasa Indonesia, Jawa dan Sunda.
Semoga Energi Semesta Digital selalu bersama Anda!