Spaces:

GAS17
/

sp

Sleeping

App Files Files Community

GAS17 commited on Oct 16, 2024

Commit

c5424e8

verified ·

1 Parent(s): 34fc453

Update app.py

Browse files

Files changed (1) hide show

app.py +5 -42

app.py CHANGED Viewed

@@ -8,58 +8,21 @@ if not replicate_token:
     raise ValueError("No se ha encontrado el token de API de Replicate.")
 # Función para dividir el archivo de audio en segmentos de duración definida (en milisegundos)
-def dividir_audio(audio_path, segment_duration_ms=5*60*1000):
     audio = AudioSegment.from_file(audio_path)
     audio_length = len(audio)
     segments = []
-    # Divide el audio en fragmentos de la duración especificada
     for i in range(0, audio_length, segment_duration_ms):
-        segment = audio[i:i + segment_duration_ms]  # Segmento de 5 minutos (o lo que se especifique)
         segment_path = f"segment_{i // (60 * 1000)}.wav"  # Nombre del archivo con el índice del minuto
         segment.export(segment_path, format="wav")  # Exporta el fragmento como un archivo WAV
-        # Verifica el tamaño del archivo y asegura que no supere el límite de 10MB
         if os.path.getsize(segment_path) > 10 * 1024 * 1024:  # 10 MB
-            print(f"Warning: Segment {segment_path} exceeds 10MB. Reducing segment duration.")
-            return dividir_audio(audio_path, segment_duration_ms // 2)  # Recursivamente reduce el tamaño del segmento
         segments.append(segment_path)
     return segments
-# Función para transcribir el audio
-def transcribe_audio(audio_file):
-    # Cargar el archivo de audio completo
-    audio = AudioSegment.from_file(audio_file)
-    audio_duration_minutes = len(audio) / (1000 * 60)  # Duración en minutos
-    # Si el audio dura más de 5 minutos, dividirlo en segmentos de 5 minutos
-    if audio_duration_minutes > 5:
-        segments = dividir_audio(audio_file, segment_duration_ms=5 * 60 * 1000)  # 5 minutos en milisegundos
-    else:
-        segments = [audio_file]  # Si es menor de 5 minutos, no dividir
-    # Almacenar todas las transcripciones
-    all_transcriptions = []
-    # Procesar cada segmento individualmente
-    for segment_path in segments:
-        with open(segment_path, "rb") as audio:
-            output = replicate.run(
-                "vaibhavs10/incredibly-fast-whisper:3ab86df6c8f54c11309d4d1f930ac292bad43ace52d10c80d87eb258b3c9f79c",
-                input={
-                    "task": "transcribe",
-                    "audio": audio,  # El archivo de audio cargado en Gradio
-                    "language": "None",  # Detecta automáticamente el idioma
-                    "timestamp": "chunk",  # Incluye marcas de tiempo
-                    "batch_size": 64,
-                    "diarise_audio": False
-                }
-            )
-            # Almacenar la transcripción del segmento
-            all_transcriptions.append(output['text'])
-    # Combina todas las transcripciones en una sola cadena
-    full_transcription = "\n".join(all_transcriptions)
-    return full_transcription  # Devuelve la transcripción completa

     raise ValueError("No se ha encontrado el token de API de Replicate.")
 # Función para dividir el archivo de audio en segmentos de duración definida (en milisegundos)
+def dividir_audio(audio_path, segment_duration_ms):
     audio = AudioSegment.from_file(audio_path)
     audio_length = len(audio)
     segments = []
+    # Divide el audio en fragmentos de la duración especificada (5 minutos en milisegundos)
     for i in range(0, audio_length, segment_duration_ms):
+        segment = audio[i:i + segment_duration_ms]  # Cada fragmento de hasta 5 minutos
         segment_path = f"segment_{i // (60 * 1000)}.wav"  # Nombre del archivo con el índice del minuto
         segment.export(segment_path, format="wav")  # Exporta el fragmento como un archivo WAV
+        # Verifica el tamaño del archivo y asegura que no supere el límite de 10MB, ajusta si es necesario
         if os.path.getsize(segment_path) > 10 * 1024 * 1024:  # 10 MB
+            print(f"Warning: Segment {segment_path} exceeds 10MB, consider reducing segment duration.")
         segments.append(segment_path)
     return segments