Publications | Research

303 results found
Computer Vision

Clear all

Computer Vision

2023

Open-Vocabulary Panoptic Segmentation with Text-to-Image Diffusion Models

Jiarui Xu, Sifei Liu, Arash Vahdat, Wonmin Byeon, Xiaolong Wang, Shalini De Mello

CVPR

Hightlight top 10%

Zero-shot Pose Transfer for Unrigged Stylized 3D Characters

Jiashun Wang, Xueting Li, Sifei Liu, Shalini De Mello, Orazio Gallo, Xiaolong Wang, Jan Kautz

CVPR

GazeNeRF: 3D-Aware Gaze Redirection with Neural Radiance Fields

Alessandro Ruzzi, Xiangwei Shi, Xi Wang, Gengyan Li, Shalini De Mello, Hyung Jin Chang, Xucong Zhang, Otmar Hilliges

CVPR

BundleSDF: Neural 6-DoF Tracking and 3D Reconstruction of Unknown Objects

Bowen Wen, Jonathan Tremblay, Valts Blukis, Stephen Tyree, Thomas Müller, Alex Evans, Dieter Fox, Jan Kautz, Stan Birchfield

CVPR

Neuralangelo: High-Fidelity Neural Surface Reconstruction

Max Zhaoshuo Li, Thomas Müller, Alex Evans, Russell H. Taylor, Mathias Unberath, Ming-Yu Liu, Chen-Hsuan Lin

CVPR

The Best Inventions of 2023, TIME Magazine

Planning for Multi-Object Manipulation with Graph Neural Network Relational Classifiers

Yixuan Huang, Adam Conkey, Tucker Hermans

ICRA

Magic3D: High-Resolution Text-to-3D Content Creation

Chen-Hsuan Lin, Jun Gao, Luming Tang, Towaki Takikawa, Xiaohui Zeng, Xun Huang, Karsten Kreis, Sanja Fidler, Ming-Yu Liu, Tsung-Yi Lin

CVPR

Planning with Occluded Traffic Agents using Bi-Level Variational Occlusion Models

Filippos Christianos, Peter Karkus, Boris Ivanovic, Stefano V. Albrecht, Marco Pavone

ICRA

Parallel Inversion of Neural Radiance Fields for Robust Pose Estimation

Yunzhi Lin, Thomas Müller, Jonathan Tremblay, Bowen Wen, Stephen Tyree, Alex Evans, Patricio A. Vela, Stan Birchfield

ICRA

FewSOL: A Dataset for Few-Shot Object Learning in Robotic Environments

Jishnu Jaykumar P, Yu-Wei Chao, Yu Xiang

ICRA

The Best Defense is a Good Offense: Adversarial Augmentation against Adversarial Attacks

Iuri Frosio, Jan Kautz

CVPR

RGB-Only Reconstruction of Tabletop Scenes for Collision-Free Manipulator Control

Zhenggang Tang, Balakumar Sundaralingam, Jonathan Tremblay, Bowen Wen, Ye Yuan, Stephen Tyree, Charles Loop, Alexander Schwing, Stan Birchfield

ICRA

Subpixel Deblurring of Anti-Aliased Raster Clip Art

Jinfan Yang, Nicholas Vining, Shakiba Kheradmand, Nathan Carr, Leonid Sigal, Alla Sheffer

GPViT: A High Resolution Non-Hierarchical Vision Transformer with Group Propagation

Chenhongyi Yang, Jiarui Xu, Shalini De Mello, Elliot J. Crowley, Xiaolong Wang

ICLR

Notable top 25%
Oral

Robust and Controllable Object-Centric Learning through Energy-based Models

Ruixiang Zhang, Gerry Che, Boris Ivanovic, Renhao Wang, Marco Pavone, Yoshua Bengio, Liam Paull

ICLR

Target-free Text-guided Image Manipulation

Wan-Cyuan Fan, Cheng-Fu Yang, Chiao-An Yang, Frank Wang

Frido: Feature Pyramid Diffusion for Complex Scene Image Synthesis

Wan-Cyuan Fan, Yen-Chun Chen, Dongdong Chen, Yu Cheng, Lu Yuan, Frank Wang

Self-Supervised Pyramid Representation Learning for Multi-Label Visual Analysis and Beyond

Cheng-Yen Hsieh, Chih-Jung Chang, Fu-En Yang, Frank Wang

2022

Learning Robust Real-World Dexterous Grasping Policies via Implicit Shape Augmentation

Qiuyu Chen, Karl Van Wyk, Yu-Wei Chao, Wei Yang, Arsalan Mousavian, Abhishek Gupta, Dieter Fox

CORL

Task-Relevant Failure Detection for Trajectory Predictors in Autonomous Vehicles

Alec Farid, Sushant Veer, Boris Ivanovic, Karen Leung, Marco Pavone

CORL

Robust Trajectory Prediction against Adversarial Attacks

Yulong Cao, Danfei Xu, Xinshuo Weng, Z. Morely Mao, Anima Anandkumar, Chaowei Xiao, Marco Pavone

CORL

Selected for Oral Presentation

MegaPose: 6D Pose Estimation of Novel Objects via Render & Compare

Yann Labbe, Lucas Manuelli, Arsalan Mousavian, Stephen Tyree, Stan Birchfield, Jonathan Tremblay, et al.

CORL

Motion Policy Networks

Adam Fishman, Adithya Murali, Clemens Eppner, Bryan Peele, Byron Boots, Dieter Fox

"This is my unicorn, Fluffy": Personalizing frozen vision-language representations

Niv Cohen, Rinon Gal, Eli Meirom, Gal Chechik, Yuval Atzmon

ECCV

Paraphrasing Is All You Need for Novel Object Captioning

Cheng-Fu Yang, Yao-Hung Hubert Tsai, Wan-Cyuan Fan, Ruslan Salakhutdinov, Louis-Philippe Morency, Frank Wang

NeurIPS

Structural Pruning via Latency-Saliency Knapsack

Maying Shen, Hongxu Danny Yin, Pavlo Molchanov, Lei Mao, Jianna Liu, Jose M. Alvarez

Embodied Scene-aware Human Pose Estimation

Zhengyi Luo, Shun Iwase, Ye Yuan, Kris Kitani

NeurIPS

SPoVT: Semantic-Prototype Variational Transformer for Dense Point Cloud Semantic Completion

Sheng-Yu Huang, Hao-Yu Hsu, Yu-Chiang Frank Wang

NeurIPS

GENIE: Higher-Order Denoising Diffusion Solvers

Tim Dockhorn, Arash Vahdat, Karsten Kreis

NeurIPS

6-DoF Pose Estimation of Household Objects for Robotic Manipulation: An Accessible Dataset and Benchmark

Stephen Tyree, Jonathan Tremblay, Stan Birchfield, et al.

IROS

Heterogeneous-Agent Trajectory Forecasting Incorporating Class Uncertainty

Boris Ivanovic, Kuan-Hui Lee, Pavel Tokmakov, Blake Wulfe, Adrien Gaidon, Marco Pavone

Text2LIVE: Text-Driven Layered Image and Video Editing

Omer Bar-Tal, Dolev Ofri-Amar, Rafail Fridman, Yoni Kasten, Tali Dekel

ECCV

Filters

Research Areas

Events

2023

2022

Filters

Publication Year

Research Areas

Events

2023

2022