Spaces:

clinical-assistance
/

medical_transcription

Runtime error

App Files Files Community

Sebastian Tinoco commited on Apr 21

Commit

a394acb

•

1 Parent(s): 2bde6db

first commit

Browse files

Files changed (3) hide show

app.py +64 -0
requirements.txt +74 -0
utils.py +15 -0

app.py ADDED Viewed

	@@ -0,0 +1,64 @@

+from transformers import pipeline
+import torch
+import gradio as gr
+import os
+from dotenv import load_dotenv
+from huggingface_hub import login
+from utils import parse_args
+args = parse_args()
+model = args['model']
+model_name = "clinical-assistance/" + model
+# Load secrets
+load_dotenv()
+token = os.getenv("TOKEN")
+assert token is not None, 'Hugging Face token has not been specified. Please specify your token in a .env file.'
+# Login to Hugging Face
+login(token=token)
+# Init model
+device = 'cuda:0' if torch.cuda.is_available() else 'cpu'
+generate_kwargs = {"language":"<|es|>", "task": "transcribe"}
+pipe = pipeline(model=model_name, generate_kwargs=generate_kwargs, device = device)
+def model_transcribe(audio):
+    '''
+    Transcribes audio to text using the Whisper model.
+    '''
+    text = pipe(audio)["text"]
+    return text
+# Define the Gradio app with the correct syntax for loading the function and handling inputs/outputs
+with gr.Blocks(theme=gr.themes.Base()) as demo:
+    with gr.Row():
+        gr.Markdown(
+            """
+            # Transcripción Automática de Consultas Médicas 👨🏻‍⚕️🚀
+            Bienvenido a la herramienta de transcripción de consultas médicas! Esta herramienta está diseñada para transcribir grabaciones de consultas médicas usando `Whisper`.
+            ## Cómo usar esta herramienta?
+            Usar esta herramienta es fácil! Sólo debes seguir los siguientes pasos:
+            1. Sube la grabación de una consulta médica. Opcionalmente puedes grabar audio y subir la grabación.
+            2. Realizar click en "Transcribir" para comenzar el proceso de transcripción.
+            3. Visualizar el audio transcrito en el panel de la derecha.
+            Eso es todo! Estás listo para transcribir grabaciones de consultas médicas de manera automática. Que lo disfrutes!
+            """
+        )
+    with gr.Row():
+        audio_input = gr.Audio(sources=["upload", "microphone"], type="filepath", label="Audio de Entrada")
+        text_output = gr.Textbox(label="Texto de Salida")
+    with gr.Row():
+        button = gr.Button("Transcribir")
+    # Correct method to link function with inputs and outputs
+    button.click(fn=model_transcribe, inputs=audio_input, outputs=text_output)
+# Use demo.launch() to launch the interface with optional debug mode
+demo.launch(debug=True, share = True)

requirements.txt ADDED Viewed

	@@ -0,0 +1,74 @@

+aiofiles==23.2.1
+altair==5.3.0
+annotated-types==0.6.0
+anyio==4.3.0
+attrs==23.2.0
+certifi==2024.2.2
+charset-normalizer==3.3.2
+click==8.1.7
+contourpy==1.2.1
+cycler==0.12.1
+exceptiongroup==1.2.1
+fastapi==0.110.2
+ffmpy==0.3.2
+filelock==3.13.4
+fonttools==4.51.0
+fsspec==2024.3.1
+gradio==4.27.0
+gradio_client==0.15.1
+h11==0.14.0
+httpcore==1.0.5
+httpx==0.27.0
+huggingface-hub==0.22.2
+idna==3.7
+importlib_resources==6.4.0
+Jinja2==3.1.3
+jsonschema==4.21.1
+jsonschema-specifications==2023.12.1
+kiwisolver==1.4.5
+markdown-it-py==3.0.0
+MarkupSafe==2.1.5
+matplotlib==3.8.4
+mdurl==0.1.2
+mpmath==1.3.0
+networkx==3.3
+numpy==1.26.4
+orjson==3.10.1
+packaging==24.0
+pandas==2.2.2
+pillow==10.3.0
+pydantic==2.7.0
+pydantic_core==2.18.1
+pydub==0.25.1
+Pygments==2.17.2
+pyparsing==3.1.2
+python-dateutil==2.9.0.post0
+python-dotenv==1.0.1
+python-multipart==0.0.9
+pytz==2024.1
+PyYAML==6.0.1
+referencing==0.34.0
+regex==2024.4.16
+requests==2.31.0
+rich==13.7.1
+rpds-py==0.18.0
+ruff==0.4.1
+safetensors==0.4.3
+semantic-version==2.10.0
+shellingham==1.5.4
+six==1.16.0
+sniffio==1.3.1
+starlette==0.37.2
+sympy==1.12
+tokenizers==0.19.1
+tomlkit==0.12.0
+toolz==0.12.1
+torch==2.2.2
+tqdm==4.66.2
+transformers==4.40.0
+typer==0.12.3
+typing_extensions==4.11.0
+tzdata==2024.1
+urllib3==2.2.1
+uvicorn==0.29.0
+websockets==11.0.3

utils.py ADDED Viewed

	@@ -0,0 +1,15 @@

+import argparse
+from distutils.util import strtobool
+def parse_args():
+    parser = argparse.ArgumentParser()
+    # env arguments
+    parser.add_argument('--model', type = str, default = 'whisper_medium_baseline_1', help = 'whisper model for inference')
+    # consolidate args
+    args = parser.parse_args()
+    args = vars(args)
+    return args