import gradio as gr import requests import os from dotenv import load_dotenv from datetime import datetime, timedelta # Cargar variables de entorno desde el archivo .env load_dotenv() # Constantes para el script CHUNK_SIZE = 1024 # Tamaño de los chunks para leer/escribir a la vez XI_API_KEY = os.getenv("XI_API_KEY") # Tu clave API para autenticación VOICE_ID = os.getenv("VOICE_ID") # ID del modelo de voz a utilizar # Diccionario para almacenar la información de los usuarios user_data = {} # Configuración de límites MESSAGE_LIMIT = 2 TIME_LIMIT = timedelta(hours=2) def text_to_speech(text, user_id): current_time = datetime.now() if user_id not in user_data: user_data[user_id] = {'messages': [], 'last_reset': current_time} user_info = user_data[user_id] # Resetear el contador si ha pasado el tiempo límite if current_time - user_info['last_reset'] > TIME_LIMIT: user_info['messages'] = [] user_info['last_reset'] = current_time # Verificar si el usuario ha alcanzado el límite de mensajes if len(user_info['messages']) >= MESSAGE_LIMIT: return f"Error: Límite de mensajes alcanzado. Intenta nuevamente en 2 horas." # URL para la solicitud de la API de Text-to-Speech tts_url = f"https://api.elevenlabs.io/v1/text-to-speech/{VOICE_ID}/stream" # Encabezados para la solicitud de la API, incluida la clave API para autenticación headers = { "Accept": "application/json", "xi-api-key": XI_API_KEY } # Datos de carga útil para la solicitud de la API, incluidos los ajustes de texto y voz data = { "text": text, "model_id": "eleven_multilingual_v2", "voice_settings": { "stability": 0.5, "similarity_boost": 0.8, "style": 0.0, "use_speaker_boost": True } } # Realizar la solicitud POST a la API de TTS con encabezados y datos, habilitando la respuesta en streaming response = requests.post(tts_url, headers=headers, json=data, stream=True) # Verificar si la solicitud fue exitosa if response.ok: # Crear un archivo temporal para guardar el audio output_path = "output.mp3" with open(output_path, "wb") as f: # Leer la respuesta en chunks y escribir en el archivo for chunk in response.iter_content(chunk_size=CHUNK_SIZE): f.write(chunk) # Registrar el nuevo mensaje user_info['messages'].append({'message': text, 'time': current_time}) return output_path else: return f"Error: {response.text}" # Crear una interfaz de Gradio para la entrada de texto y la generación de audio iface = gr.Interface( fn=text_to_speech, inputs=["text", "text"], # Añadir un segundo campo de texto para el user_id outputs="audio", title="Generador de Texto a Voz", description="Ingrese el texto para convertir a voz y su ID de usuario." ) # Ejecutar la interfaz if __name__ == "__main__": iface.launch()