File size: 3,382 Bytes
2f9ec6c 1f673e5 889bf3d 2f9ec6c 889bf3d 1f673e5 ad59631 1f673e5 889bf3d 1f673e5 889bf3d 1f673e5 0b1ec24 889bf3d 1f673e5 889bf3d 1f673e5 889bf3d 1f673e5 2f9ec6c 0b1ec24 2f9ec6c 889bf3d 2f9ec6c 0b1ec24 2f9ec6c 0b1ec24 2f9ec6c |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 |
import gradio as gr
import requests
import os
from dotenv import load_dotenv
from datetime import datetime, timedelta
from flask import Flask, jsonify
# Cargar variables de entorno desde el archivo .env
load_dotenv()
# Constantes para el script
CHUNK_SIZE = 1024 # Tama帽o de los chunks para leer/escribir a la vez
XI_API_KEY = os.getenv("XI_API_KEY") # Tu clave API para autenticaci贸n
VOICE_ID = os.getenv("VOICE_ID") # ID del modelo de voz a utilizar
# Diccionario para almacenar la informaci贸n de uso
usage_data = {
'message_count': 0,
'last_reset': datetime.now()
}
# Configuraci贸n de l铆mites
MESSAGE_LIMIT = 45
TIME_LIMIT = timedelta(hours=2)
# Crear la aplicaci贸n Flask
app = Flask(__name__)
@app.route('/reset_usage', methods=['POST'])
def reset_usage():
global usage_data
usage_data = {
'message_count': 0,
'last_reset': datetime.now()
}
return jsonify({"success": "Usage reset."}), 200
def text_to_speech(text, style):
global usage_data
current_time = datetime.now()
# Resetear el contador si ha pasado el tiempo l铆mite
if current_time - usage_data['last_reset'] > TIME_LIMIT:
usage_data = {
'message_count': 0,
'last_reset': current_time
}
# Verificar si se ha alcanzado el l铆mite de mensajes
if usage_data['message_count'] >= MESSAGE_LIMIT:
return "Error: L铆mite de mensajes alcanzado. Intenta nuevamente en 2 horas."
# URL para la solicitud de la API de Text-to-Speech
tts_url = f"https://api.elevenlabs.io/v1/text-to-speech/{VOICE_ID}/stream"
# Encabezados para la solicitud de la API, incluida la clave API para autenticaci贸n
headers = {
"Accept": "application/json",
"xi-api-key": XI_API_KEY
}
# Datos de carga 煤til para la solicitud de la API, incluidos los ajustes de texto y voz
data = {
"text": text,
"model_id": "eleven_multilingual_v2",
"voice_settings": {
"stability": 0.5,
"similarity_boost": 0.8,
"style": style, # Usar el valor de estilo proporcionado por el usuario
"use_speaker_boost": True
}
}
# Realizar la solicitud POST a la API de TTS con encabezados y datos, habilitando la respuesta en streaming
response = requests.post(tts_url, headers=headers, json=data, stream=True)
# Verificar si la solicitud fue exitosa
if response.ok:
# Crear un archivo temporal para guardar el audio
output_path = "output.mp3"
with open(output_path, "wb") as f:
# Leer la respuesta en chunks y escribir en el archivo
for chunk in response.iter_content(chunk_size=CHUNK_SIZE):
f.write(chunk)
# Incrementar el contador de mensajes
usage_data['message_count'] += 1
return output_path
else:
return f"Error: {response.text}"
# Crear una interfaz de Gradio para la entrada de texto y la generaci贸n de audio
iface = gr.Interface(
fn=text_to_speech,
inputs=[gr.Textbox(label="Texto"), gr.Slider(minimum=0, maximum=1, step=0.1, label="Style")], # A帽adir barra para style
outputs="audio",
title="Text to Speech con Ajuste de Estilo",
description="Genera audio a partir de texto con ajuste de estilo."
)
# Ejecutar la interfaz
if __name__ == "__main__":
iface.launch()
|