File size: 3,382 Bytes
2f9ec6c
 
 
 
1f673e5
889bf3d
2f9ec6c
 
 
 
 
 
 
 
 
889bf3d
 
 
 
 
1f673e5
 
ad59631
1f673e5
 
889bf3d
 
1f673e5
889bf3d
 
 
 
 
 
 
 
1f673e5
0b1ec24
889bf3d
 
1f673e5
 
889bf3d
 
 
 
 
1f673e5
889bf3d
 
 
1f673e5
2f9ec6c
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
0b1ec24
2f9ec6c
 
 
 
 
 
 
 
 
 
 
 
 
 
 
889bf3d
 
2f9ec6c
 
 
 
 
 
 
0b1ec24
2f9ec6c
0b1ec24
 
2f9ec6c
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
import gradio as gr
import requests
import os
from dotenv import load_dotenv
from datetime import datetime, timedelta
from flask import Flask, jsonify

# Cargar variables de entorno desde el archivo .env
load_dotenv()

# Constantes para el script
CHUNK_SIZE = 1024  # Tama帽o de los chunks para leer/escribir a la vez
XI_API_KEY = os.getenv("XI_API_KEY")  # Tu clave API para autenticaci贸n
VOICE_ID = os.getenv("VOICE_ID")  # ID del modelo de voz a utilizar

# Diccionario para almacenar la informaci贸n de uso
usage_data = {
    'message_count': 0,
    'last_reset': datetime.now()
}

# Configuraci贸n de l铆mites
MESSAGE_LIMIT = 45
TIME_LIMIT = timedelta(hours=2)

# Crear la aplicaci贸n Flask
app = Flask(__name__)

@app.route('/reset_usage', methods=['POST'])
def reset_usage():
    global usage_data
    usage_data = {
        'message_count': 0,
        'last_reset': datetime.now()
    }
    return jsonify({"success": "Usage reset."}), 200

def text_to_speech(text, style):
    global usage_data
    current_time = datetime.now()

    # Resetear el contador si ha pasado el tiempo l铆mite
    if current_time - usage_data['last_reset'] > TIME_LIMIT:
        usage_data = {
            'message_count': 0,
            'last_reset': current_time
        }

    # Verificar si se ha alcanzado el l铆mite de mensajes
    if usage_data['message_count'] >= MESSAGE_LIMIT:
        return "Error: L铆mite de mensajes alcanzado. Intenta nuevamente en 2 horas."

    # URL para la solicitud de la API de Text-to-Speech
    tts_url = f"https://api.elevenlabs.io/v1/text-to-speech/{VOICE_ID}/stream"

    # Encabezados para la solicitud de la API, incluida la clave API para autenticaci贸n
    headers = {
        "Accept": "application/json",
        "xi-api-key": XI_API_KEY
    }

    # Datos de carga 煤til para la solicitud de la API, incluidos los ajustes de texto y voz
    data = {
        "text": text,
        "model_id": "eleven_multilingual_v2",
        "voice_settings": {
            "stability": 0.5,
            "similarity_boost": 0.8,
            "style": style,  # Usar el valor de estilo proporcionado por el usuario
            "use_speaker_boost": True
        }
    }

    # Realizar la solicitud POST a la API de TTS con encabezados y datos, habilitando la respuesta en streaming
    response = requests.post(tts_url, headers=headers, json=data, stream=True)

    # Verificar si la solicitud fue exitosa
    if response.ok:
        # Crear un archivo temporal para guardar el audio
        output_path = "output.mp3"
        with open(output_path, "wb") as f:
            # Leer la respuesta en chunks y escribir en el archivo
            for chunk in response.iter_content(chunk_size=CHUNK_SIZE):
                f.write(chunk)
        # Incrementar el contador de mensajes
        usage_data['message_count'] += 1
        return output_path
    else:
        return f"Error: {response.text}"

# Crear una interfaz de Gradio para la entrada de texto y la generaci贸n de audio
iface = gr.Interface(
    fn=text_to_speech,
    inputs=[gr.Textbox(label="Texto"), gr.Slider(minimum=0, maximum=1, step=0.1, label="Style")],  # A帽adir barra para style
    outputs="audio",
    title="Text to Speech con Ajuste de Estilo",
    description="Genera audio a partir de texto con ajuste de estilo."
)

# Ejecutar la interfaz
if __name__ == "__main__":
    iface.launch()