Grounded 3D-Aware Spatial Vision-Language Modeling

An-Chieh Cheng, Yang Fu, Yatai Ji, Ligeng Zhu, Guanqi Zhan, Zhuoyang Zhang, Zhaojing Yang, Song Han, Yao Lu, Pavlo Molchanov, Vidya Nariyambut Murali, Jan Kautz, Xiaolong Wang, Hongxu (Danny) Yin, Sifei Liu

June 2026

arXiv

Type

Conference paper

Publication

IEEE Conference on Computer Vision and Pattern Recognition (CVPR)
Highlight