--- tags: - text-to-image language: - en pipeline_tag: text-to-image --- ### Model drawing

[Switti](https://arxiv.org/abs/2412.01819) - *S*cale-*wi*se *t*ransformer for *t*ext-to-*i*mage synthesis is a scale-wise transformer for text-to-image generation. ### Model Description - **Developed by:** Yandex Research - **Model type:** Scale-wise text-to-image generative model ### Evaluation drawing

The bar chart above shows user preference for Switti vs competitor models with respect to different aspects.