Running
on
T4
396
π»
Note Muy buen modelo de Microsoft que crea descripciones detalladas de imΓ‘genes, marcando regiones de la imagen con su significado
Note Genera descripciones muy detalladas. Excelente
Note Detecta objetos en la escena
a tiny vision language model
Note Convierte una imagen en un prompt largo compatible con SD3
Note MiniCPM Llama3 Vision Language