VILA-U: Efficient and Unified Visual Language Understanding and Generation

Yecheng Wu, Zhuoyang Zhang, Junyu Chen, Haotian Tang, Dacheng Li, Yunhao Fang, Ligeng Zhu, Enze Xie, Hongxu (Danny) Yin, Li Yi, Song Han, Yao Lu

April 2025

arXiv

Type

Conference paper

Publication

International Conference on Learning Representations (ICLR)