retina_dev / README.md
steveGomez's picture
Update README.md
9149336 verified
metadata
tags:
  - image-to-text
  - image-captioning
license: apache-2.0
widget:
  - src: >-
      https://huggingface.co/datasets/mishig/sample_images/resolve/main/savanna.jpg
    example_title: Savanna

Modelo de Imagen a Texto

Este modelo toma una imagen como entrada y genera una descripci贸n en texto como salida. Es ideal para tareas de captioning (creaci贸n de subt铆tulos) en im谩genes y puede usarse en aplicaciones como accesibilidad visual o para agregar descripciones a im谩genes autom谩ticamente.

Uso

Para utilizar este modelo, simplemente proporciona una imagen como entrada. El modelo devolver谩 una descripci贸n en texto.

Ejemplo de c贸digo

Puedes utilizar el siguiente c贸digo en Python con la biblioteca transformers y Pillow para realizar inferencias:

from transformers import pipeline
from PIL import Image

# Cargar el pipeline para imagen a texto
image_to_text = pipeline("image-to-text", model="your-username/your-model-name")

# Cargar una imagen
image = Image.open("path/to/your-image.jpg")

# Obtener el texto de salida
caption = image_to_text(image)
print("Descripci贸n generada:", caption[0]['generated_text'])