metadata

tags:
  - image-to-text
  - image-captioning
license: apache-2.0
widget:
  - src: >-
      https://huggingface.co/datasets/mishig/sample_images/resolve/main/savanna.jpg
    example_title: Savanna

Modelo de Imagen a Texto

Este modelo toma una imagen como entrada y genera una descripción en texto como salida. Es ideal para tareas de captioning (creación de subtítulos) en imágenes y puede usarse en aplicaciones como accesibilidad visual o para agregar descripciones a imágenes automáticamente.

Uso

Para utilizar este modelo, simplemente proporciona una imagen como entrada. El modelo devolverá una descripción en texto.

Ejemplo de código

Puedes utilizar el siguiente código en Python con la biblioteca transformers y Pillow para realizar inferencias:

from transformers import pipeline
from PIL import Image

# Cargar el pipeline para imagen a texto
image_to_text = pipeline("image-to-text", model="your-username/your-model-name")

# Cargar una imagen
image = Image.open("path/to/your-image.jpg")

# Obtener el texto de salida
caption = image_to_text(image)
print("Descripción generada:", caption[0]['generated_text'])