Text-to-Image Generation

SELMA: Learning and Merging Skill-Specific Text-to-Image Experts with Auto-Generated Data

SELMA improves T2I models by fine-tuning on automatically generated multi-skill image-text datasets, with skill-specific LoRA expert learning & merging. - NeurIPS 2024

Jialu Li*, Jaemin Cho*, Yi-Lin Sung, Jaehong Yoon, Mohit Bansal

SELMA: Learning and Merging Skill-Specific Text-to-Image Experts with Auto-Generated Data

DOCCI: Descriptions of Connected and Contrasting Images

High-quality, long, human-annotated descriptions of 15K images - ECCV 2024

Yasumasa Onoe, Sunayana Rane, Zachary Berger, Yonatan Bitton, Jaemin Cho, Roopal Garg, Alexander Ku, Zarana Parekh, Jordi Pont-Tuset, Garrett Tanzer, Su Wang, Jason Baldridge

DOCCI: Descriptions of Connected and Contrasting Images

Davidsonian Scene Graph: Improving Reliability in Fine-Grained Evaluation for Text-to-Image Generation

Reliable QG/A framework for T2I Evaluation based on Davidsonian Semantics - ICLR 2024

Jaemin Cho, Yushi Hu, Roopal Garg, Peter Anderson, Ranjay Krishna, Jason Baldridge, Mohit Bansal, Jordi Pont-Tuset, Su Wang

Davidsonian Scene Graph: Improving Reliability in Fine-Grained Evaluation for Text-to-Image Generation

Visual Programming for Text-to-Image Generation and Evaluation

Interpretable/explainable visual programming frameworks for T2I generation (VPGen) and evaluation (VPEval) - NeurIPS 2023

Jaemin Cho, Abhay Zala, Mohit Bansal

Visual Programming for Text-to-Image Generation and Evaluation

DALL-Eval: Probing the Reasoning Skills and Social Biases of Text-to-Image Generation Models

Evaluation of Text-to-Image Generation Models in Reasoning Skills and Social Biases - ICCV 2023

Jaemin Cho, Abhay Zala, Mohit Bansal

DALL-Eval: Probing the Reasoning Skills and Social Biases of Text-to-Image Generation Models

X-LXMERT: Paint, Caption and Answer Questions with Multi-Modal Transformers

Text-to-Image Generation via predicting vector-quantized image patches with multimodal LMs - EMNLP 2020

Jaemin Cho, Jiasen Lu, Dustin Schwenk, Hannaneh Hajishirzi, Aniruddha Kembhavi