Spaces:

GAS17
/

vi

Running

File size: 2,969 Bytes

import gradio as gr
import requests
import os
from dotenv import load_dotenv
from datetime import datetime, timedelta

# Cargar variables de entorno desde el archivo .env
load_dotenv()

# Constantes para el script
CHUNK_SIZE = 1024  # Tamaño de los chunks para leer/escribir a la vez
XI_API_KEY = os.getenv("XI_API_KEY")  # Tu clave API para autenticación
VOICE_ID = os.getenv("VOICE_ID")  # ID del modelo de voz a utilizar

# Diccionario para almacenar la información de los usuarios
user_data = {}

# Configuración de límites
MESSAGE_LIMIT = 2
TIME_LIMIT = timedelta(hours=2)

def text_to_speech(text, user_id):
    current_time = datetime.now()

    if user_id not in user_data:
        user_data[user_id] = {'messages': [], 'last_reset': current_time}

    user_info = user_data[user_id]

    # Resetear el contador si ha pasado el tiempo límite
    if current_time - user_info['last_reset'] > TIME_LIMIT:
        user_info['messages'] = []
        user_info['last_reset'] = current_time

    # Verificar si el usuario ha alcanzado el límite de mensajes
    if len(user_info['messages']) >= MESSAGE_LIMIT:
        return f"Error: Límite de mensajes alcanzado. Intenta nuevamente en 2 horas."

    # URL para la solicitud de la API de Text-to-Speech
    tts_url = f"https://api.elevenlabs.io/v1/text-to-speech/{VOICE_ID}/stream"

    # Encabezados para la solicitud de la API, incluida la clave API para autenticación
    headers = {
        "Accept": "application/json",
        "xi-api-key": XI_API_KEY
    }

    # Datos de carga útil para la solicitud de la API, incluidos los ajustes de texto y voz
    data = {
        "text": text,
        "model_id": "eleven_multilingual_v2",
        "voice_settings": {
            "stability": 0.5,
            "similarity_boost": 0.8,
            "style": 0.0,
            "use_speaker_boost": True
        }
    }

    # Realizar la solicitud POST a la API de TTS con encabezados y datos, habilitando la respuesta en streaming
    response = requests.post(tts_url, headers=headers, json=data, stream=True)

    # Verificar si la solicitud fue exitosa
    if response.ok:
        # Crear un archivo temporal para guardar el audio
        output_path = "output.mp3"
        with open(output_path, "wb") as f:
            # Leer la respuesta en chunks y escribir en el archivo
            for chunk in response.iter_content(chunk_size=CHUNK_SIZE):
                f.write(chunk)
        # Registrar el nuevo mensaje
        user_info['messages'].append({'message': text, 'time': current_time})
        return output_path
    else:
        return f"Error: {response.text}"

# Crear una interfaz de Gradio para la entrada de texto y la generación de audio
iface = gr.Interface(
    fn=text_to_speech,
    inputs=["text", "text"],  # Añadir un segundo campo de texto para el user_id
    outputs="audio",
    title="",
    description="texto"
)

# Ejecutar la interfaz
if __name__ == "__main__":
    iface.launch()