Mantis - a TIGER-Lab Collection

TIGER-Lab 's Collections

Copilot

VISTA

VLM2Vec

MAmmoTH

UniIR

Science

Mantis

Mantis

updated Jul 2

Mantis model family optimized for multi-image reasoning with interleaved text/image format

TIGER-Lab/Mantis-8B-Idefics2

Image-Text-to-Text • Updated Nov 15 • 519 • 10

Note Current SoTA Mantis variant
TIGER-Lab/Mantis-8B-clip-llama3

Image-Text-to-Text • Updated Nov 15 • 547 • 1
TIGER-Lab/Mantis-8B-siglip-llama3

Image-Text-to-Text • Updated Nov 15 • 3.63k • 31

Note Current SoTA Mantis variant without multi-image pre-training
TIGER-Lab/Mantis-Instruct

Viewer • Updated Nov 15 • 999k • 1.48k • 30

Note Our training dataset
TIGER-Lab/Mantis-Eval

Viewer • Updated Nov 15 • 217 • 1.62k • 6

Note Curated evaluation benchmark for multi-image scenarios
MANTIS: Interleaved Multi-Image Instruction Tuning

Paper • 2405.01483 • Published May 2 • 6
Running on Zero

24

👁

Mantis

Multimodal Language Model
TIGER-Lab/Mantis-llava-7b

Image-Text-to-Text • Updated May 18 • 16 • 15
TIGER-Lab/Mantis-bakllava-7b

Image-Text-to-Text • Updated May 18 • 21 • 5
TIGER-Lab/Mantis-8B-Fuyu

Text Generation • Updated May 4 • 311 • 4
TIGER-Lab/OBELICS-100K

Viewer • Updated May 16 • 212k • 35 • 2