SpatialRGPT: Grounded Spatial Reasoning in Vision-Language Models

An-Chieh Cheng, Hongxu (Danny) Yin, Yang Fu, Qiushan Guo, Ruihan Yang, Jan Kautz, Xiaolong Wang, Sifei Liu

December 2024

arXiv

Type

Conference paper

Publication

Advances in Neural Information Processing Systems (NeurIPS)