GUI Intelligence - a johannhartmann Collection

johannhartmann 's Collections

GUI Intelligence

Document & UI Intelligence

Multimodal Models

Medical MultiModal

GUI Intelligence

updated Jan 27

bytedance-research/UI-TARS-72B-DPO

Image-Text-to-Text • Updated Jan 25 • 26.4k • 94
bytedance-research/UI-TARS-7B-DPO

Image-Text-to-Text • Updated Jan 25 • 27.7k • 148
microsoft/OmniParser

Image-Text-to-Text • Updated Dec 2, 2024 • 2.62k • 1.63k
jadechoghari/Ferret-UI-Llama8b

Image-Text-to-Text • Updated Jan 8 • 606 • 68