VILA: On pretraining for vision language models

Ji Lin, Hongxu (Danny) Yin, Wei Ping, Yao Lu, Pavlo Molchanov, Andrew Tao, Huizi Mao, Jan Kautz, Mohammad Shoeybi, Song Han

June 2024

arXiv

Type

Conference paper

Publication

IEEE Conference on Computer Vision and Pattern Recognition (CVPR)