Edit Models filters

Multimodal

Visual Question Answering

Image-Text-to-Text

Document Question Answering

Computer Vision

Image Classification

Object Detection

Video Classification

Image Segmentation

Zero-Shot Image Classification

Image Feature Extraction

Mask Generation

Depth Estimation

Zero-Shot Object Detection

Unconditional Image Generation

Natural Language Processing

Text Generation

Text Classification

Text2Text Generation

Token Classification

Question Answering

Feature Extraction

Sentence Similarity

Zero-Shot Classification

Table Question Answering

Audio

Automatic Speech Recognition

Audio Classification

Voice Activity Detection

Tabular

Tabular Classification

Tabular Regression

Time Series Forecasting

Reinforcement Learning

Reinforcement Learning

Other

Graph Machine Learning

Models

313

Full-text search

Active filters: visual-question-answering, transformers

hyo37009/git-vqa-finetuned-on-ok-vqa

Visual Question Answering • Updated Dec 13, 2023

jaimik69/blip_finetuned

Visual Question Answering • Updated Nov 29, 2023 • 5

Atul8827/vilt_finetuned_200

Visual Question Answering • Updated Feb 27

dineshcr7/BLIP-LORA-TRY

Visual Question Answering • Updated Dec 3, 2023 • 7

nanom/pix2struct-vizwizvqa-base

Visual Question Answering • Updated Dec 6, 2023

DylanJHJ/blip-base-129M

Visual Question Answering • Updated Dec 6, 2023 • 4

ChirathD/Blip-2-test-1

Visual Question Answering • Updated Dec 6, 2023 • 3

ChirathD/Blip-2-test-2

Visual Question Answering • Updated Dec 7, 2023

ChirathD/Blip-2-test-3

Visual Question Answering • Updated Dec 7, 2023

rkushwah16/vilt_finetuned_200

Visual Question Answering • Updated Dec 10, 2023

xtuner/llava-internlm-7b-pretrain

Visual Question Answering • Updated Mar 6 • 11

xtuner/llava-v1.5-7b-xtuner-pretrain

Visual Question Answering • Updated Mar 6 • 2

aisuko/ft-vilt-b32-mlm

Visual Question Answering • Updated Dec 15, 2023 • 7

nuua/ko-deplot

Visual Question Answering • Updated Jan 5 • 183 • 4

xtuner/llava-v1.5-13b-xtuner-pretrain

Visual Question Answering • Updated Mar 6 • 7

OpenGVLab/InternVL-Chat-ViT-6B-Vicuna-7B

Visual Question Answering • Updated Apr 27 • 933 • 7

OpenGVLab/InternVL-Chat-ViT-6B-Vicuna-13B

Visual Question Answering • Updated Apr 27 • 27 • 6

wesley7137/BlipFinetune-ScienceQA

Visual Question Answering • Updated Jan 10

marwanimroz18/blip-trainer

Visual Question Answering • Updated Jan 15 • 38

xtuner/llava-internlm2-7b-pretrain

Visual Question Answering • Updated Mar 6

xtuner/llava-internlm2-20b-pretrain

Visual Question Answering • Updated Mar 6 • 2

TeeA/MATCHA-ViChart

Visual Question Answering • Updated Jan 17 • 3

TeeA/DONUT-ViChart

Visual Question Answering • Updated May 18 • 4

TeeA/MATCHA-ChartQA-v1

Visual Question Answering • Updated Jan 17 • 2

OpenGVLab/InternVL-Chat-V1-1

Visual Question Answering • Updated May 29 • 111 • 11

RaviNaik/Llava-Phi2

Visual Question Answering • Updated Jan 26 • 5 • 5

GunaKoppula/Llava-Phi2

Visual Question Answering • Updated Jan 27

Navyabhat/Llava-Phi2

Visual Question Answering • Updated Jan 28 • 2 • 1

leejuhyoeng/test_1

Visual Question Answering • Updated Feb 1

Barth371/training

Visual Question Answering • Updated Feb 9