Publications | Research

2025

Peter Karkus, Maximilian Igl, Yuxiao Chen, Kashyap Chitta, Jef Packer, Bertrand Douillard, Thomas Tian, Alexander Naumann, Guillermo Garcia-Cobo, Shuhan Tan, Alperen Degirmenci, Alexander Popov, Nikolai Smolyanskiy, Urs Muller, Boris Ivanovic, Marco Pavone

Policy Optimized Text-to-Image Pipeline Design

Uri Gadot, Rinon Gal, Yftah Zisser, Gal Chechik, Shie Mannor

NeurIPS

Elucidated Rolling Diffusion Models for Probabilistic Weather Forecasting

Salva Rühling Cachay, Miika Aittala, Karsten Kreis, Noah Brenowitz, Arash Vahdat, Morteza Mardani, Rose Yu

NeurIPS

Align Your Flow: Scaling Continuous-Time Flow Map Distillation

Amirmojtaba Sabour, Sanja Fidler, Karsten Kreis

NeurIPS

ThinkAct: Vision-Language-Action Reasoning via Reinforced Visual Latent Planning

Chi-Pin Huang, Yueh-Hua Wu, Min-Hung Chen, Frank Wang, Fred Yang

NeurIPS

Generalizable Domain Adaptation for Sim-and-Real Policy Co-Training

Shuo Cheng, Liqian Ma, Zhenyang Chen, Ajay Mandlekar, Caelan Garrett, Danfei Xu

NeurIPS

RaySt3R: Predicting Novel Depth Maps for Zero-Shot Object Completion

Bardienus P. Duisterhof, Jan Oberst, Bowen Wen, Stan Birchfield, Deva Ramanan, Jeffrey Ichnowski

NeurIPS

Attention on the Sphere

Boris Bonev, Max Rietmann, Andrea Paris, Alberto Carpentieri, Thorsten Kurth

NeurIPS

Seeing What Matters: Generalizable AI-generated Video Detection with Forensic-Oriented Augmentation

Riccardo Corvi, Davide Cozzolino, Ekta Prashnani, Shalini De Mello, Koki Nagano, Luisa Verdoliva

NeurIPS

Augmenting Simulated Noisy Quantum Data Collection by Orders of Magnitude Using Pre-Trajectory Sampling with Batched Execution

Taylor Patti, Thien Nguyen, Justin Lietz, Alex McCaskey, Brucek Khailany

Data-Driven Loss Functions for Inference-Time Optimization in Text-to-Image

Sapir Yflah, Yuval Atzmon, Gal Chechik

ScheduleStream: Temporal Planning with Samplers for GPU-Accelerated Multi-Arm Task and Motion Planning & Scheduling

Caelan Garrett, Fabio Ramos

Alpamayo-R1: Bridging Reasoning and Action Prediction for Generalizable Autonomous Driving in the Long Tail

Marco Pavone, Many other contributors found on Page 33

The Reality Gap in Robotics: Challenges, Solutions, and Best Practices

Elie Aljalbout, Jiaxu Xing, Angel Romero, Iretiayo Akinola, Caelan Garrett, Eric Heiden, Abhishek Gupta, Tucker Hermans, Yashraj Narang, Dieter Fox, Davide Scaramuzza, Fabio Ramos

Task-Oriented Human Grasp Synthesis via Context- and Task-Aware Diffusers

An-Lun Liu, Yu-Wei Chao, Yi-Ting Chen

ICCV

ACGD: Visual Multitask Policy Learning with Asymmetric Critic Guided Distillation

Krishnan Srinivasan, Jie Xu, Henry Ang, Eric Heiden, Dieter Fox, Jeannette Bohg, Animesh Garg

IROS

SALAD: Self-Adaptive Link Adaptation

Reinhard Wiesmayr, Lorenzo Maggi, Sebastian Cammerer, Jakob Hoydis, Fayçal Aït Aoudia , Alex Keller

Pedestrian Collision Avoidance in Hemianopia during Natural Walking in Immersive Virtual Reality

Jonathan K. Doyon, Sujin Kim, Alex D. Hwang, Jae-Hyun Jung

Isaac Lab: A GPU Accelerated Simulation Framework For Multi-Modal Robot Learning

Mayank Mittal, Kelly Guo, Gavriel State, Spencer Huang

World Simulation With Video Foundation Models for Physical AI

Ming-Yu Liu,

VT-Refine: Learning Bimanual Assembly with Visuo-Tactile Feedback via Simulation Fine-Tuning

Binghao Huang, Jie Xu, Iretiayo Akinola, Wei Yang, Balakumar Sundaralingam, Rowland O'Flaherty, Dieter Fox, Xiaolong Wang, Arsalan Mousavian, Yu-Wei Chao, Yunzhu Li

CORL

Dexplore: Scalable Neural Control for Dexterous Manipulation from Reference-Scoped Exploration

Sirui Xu, Yu-Wei Chao, Liuyu Bian, Arsalan Mousavian, Yu-Xiong Wang, Liang-Yan Gui, Wei Yang

CORL

Neural Robot Dynamics

Jie Xu, Eric Heiden, Iretiayo Akinola, Dieter Fox, Miles Macklin, Yashraj Narang

CORL

Learning to Plan & Schedule with Reinforcement-Learned Bimanual Robot Skills

Weikang Wan, Fabio Ramos, Xuning Yang, Caelan Garrett

CORL

ReinforceGen: Hybrid Skill Policies with Automated Data Generation and Reinforcement Learning

Zihan Zhou, Animesh Garg, Ajay Mandlekar, Caelan Garrett

FVDebug: An LLM-Driven Debugging Assistant for Automated Root Cause Analysis of Formal Verification Failures

Yunsheng Bai, Ghaith Bany Hamad, Chia-Tung (Mark) Ho, Syed Suhaib, Mark Haoxing Ren

Huge ensembles–Part 1: Design of ensemble weather forecasts using spherical Fourier neural operators

Ankur Mahesh, William D. Collins, Boris Bonev, Noah Brenowitz, Yair Cohen, Joshua Elms, Peter Harrington, Karthik Kashinath, Thorsten Kurth, Joshua North, Travis O'Brian, Mike Pritchard, David Pruitt, Mark Risser, Shashank Subramanian, Jared Willard

Huge ensembles – Part 2: Properties of a huge ensemble of hindcasts generated with spherical Fourier neural operators

Ankur Mahesh, William D. Collins, Boris Bonev, Noah Brenowitz, Yair Cohen, Peter Harrington, Karthik Kashinath, Thorsten Kurth, Joshua North, Travis O'Brian, Mike Pritchard, David Pruitt, Mark Risser, Shashank Subramanian, Jared Willard

Real-time 3D Visualization of Radiance Fields on Light Field Displays

Jonghyun Kim, Cheng Sun, Michael Stengel, Matthew Chan, Andrew Russell, Jaehyun Jung, Wil Braithewaite, Shalini De Mello, David Luebke

VoiceNoNG: Robust High-Quality Speech Editing Model without Hallucinations

Sung-Feng Huang, Heng-Cheng Kuo, Zhehuai Chen, Xuesong Yang, Pin-Jui Ku, Ante Jukić, Huck Yang, Yu Tsao, Frank Wang, Hung-yi Lee, Szu-Wei Fu

GEN3C: 3D-Informed World-Consistent Video Generation with Precise Camera Control

Xuanchi Ren, Tianchang Shen, Jiahui Huang, Huan Ling, Yifan Lu, Merlin Nimier-David, Thomas Müller, Alex Keller, Sanja Fidler, Jun Gao