Publications | Research

2026

Adaptive Time Delay for Improving Player Experience and Fairness in First-Person Shooter Games with Network Latency

Samin Shahriar Tokey, Ben Boudaoud, Josef Spjut, Mark Claypool

Impact of Frametime Spikes on Performance and Quality of Experience in Platformer Games

Samin Shahriar Tokey, Ben Boudaoud, Josef Spjut, Mark Claypool

Spatial-IQ: Deconstructing Spatial Intelligence via Hierarchical Capability Tests

Patrick Rim, Tom Long, Ekta Prashnani, Ruth Rosenholtz, Ben Boudaoud, Peter Xenopoulos, Alex Wong, Joohwan Kim, Jae-Hyun Jung

GalaxyDiT: Efficient Video Generation with Guidance Alignment and Adaptive Proxy in Diffusion Transformers

Zoey Song, Steve Dai, Ben Keller, Brucek Khailany

Performance, Rendering, and Interaction in Competitive Esports (PRICE)

Josef Spjut, Benjamin Watson, Madison Klarkowski, Rulon Raymond, Mark Claypool, Paul Ritaldato

SIGGRAPH

Autonomous Discovery of Wireless Communications Algorithms

Fayçal Aït Aoudia , Jakob Hoydis, Sebastian Cammerer, Glan Marti, Merlin Nimier-David, Nicolas Roussel, Alex Keller

CTRL-G: Controllable Generative Graphics for Games

Josef Spjut, Arnav Jhala, Anjul Patney, Michael Lentine, Monde Duinkharjav

SIGGRAPH

Clustered Codebook Quantization for 2D Gaussian-based Image Compression

Runze Cheng, Yicheng Zhan, Josef Spjut, Kaan Akşit

SIGGRAPH

Towards Field Experiments in Esports Competition

Arjun Madhusudan, Josef Spjut, Ben Boudaoud, Joohwan Kim, Benjamin Watson

SIGGRAPH

Understanding Emergent Non-Verbal Communication in the Delta Force Competitive Video Game through Multimodal AI Analysis

Jinyuan Guo, Josef Spjut

SIGGRAPH

Real-time 3D Visualization of Radiance Fields on Light Field Displays

Jonghyun Kim, Cheng Sun, Michael Stengel, Matthew Chan, Andrew Russell, Jae-Hyun Jung, Wil Braithwaite, Shalini De Mello, David Luebke

Fast and accurate AI-based pre-decoders for color codes

Jan Olle, Christopher Chamberland, Muyuan Li, Igor Baratta

The 2M Multiplication Algorithm for Complex Matrices

Peter Caday

Mixed-Precision SVD on GPUs via Ogita–Aishima Iterative Refinement

Angelika Schwarz, Rasmus Munk Larsen, Samuel Rodriguez, Christopher Baker, Lev Kruglyak

Pedestrian Collision Detection and Avoidance in Cerebral Visual Impairment During Unrestricted Walking in an Immersive Virtual Reality Environment

Jonathan Doyon, Madeleine Heynan, Wei Hay Lew, Alex D. Hwang, Jae-Hyun Jung, Lotfi B. Merabet

Fearless Concurrency on the GPU

Melih Elibol, Jared Roesch, Isaac Gelado, Eric Buehler, Michael Garland

SuperCollider: Scalable and Effective Data Race Detection for CUDA

Mark Stephenson, Sana Damani, Mohamed Tarek Ibn Ziad, Anis Ladram, Michael Garland

PLDI

Editing Physiological Signals in Videos Using Latent Representations

Tianwen Zhou, Akshay Paruchuri, Josef Spjut, Kaan Akşit

CVPR

ScheduleStream: Temporal Planning with Samplers for GPU-Accelerated Multi-Arm Task and Motion Planning & Scheduling

Caelan Garrett, Fabio Ramos

Monitor refresh rate impacts FPS video gamers' perceptions of display ‘smoothness’ and target acquisition performance

Adam J. Toth, Joohwan Kim, Josef Spjut, Ben Boudaoud, Sophie Cunneen, Mark J. Campbell

HumanoidMimicGen: Data Generation for Loco-Manipulation via Whole-Body Planning

Kevin Lin, Ajay Mandlekar, Caelan Garrett, Nikita Cherniadev, Yu Fang, Runyu Ding, Yuqi Xie, Justin Tran, Linxi "Jim" Fan, Yuke Zhu

ICRA

Best Workshop Paper Finalist

ReinforceGen: Hybrid Skill Policies with Automated Data Generation and Reinforcement Learning

Zihan Zhou, Animesh Garg, Ajay Mandlekar, Caelan Garrett

ICRA

Do What You Say: Steering Vision-Language-Action Models via Runtime Reasoning-Action Alignment Verification

Yilin Wu, Anqi Li, Tucker Hermans, Fabio Ramos, Andrea Bajcs, Claudia D’Arpino

ICRA

GPUArmor: A Hardware-Software Co-design for Efficient and Scalable Memory Safety on GPUs

Mohamed Tarek Ibn Ziad, Sana Damani, Mark Stephenson, Steve Keckler, Aamer Jaleel

Gated DeltaNet-2: Decoupling Erase and Write in Linear Attention

Ali Hatamizadeh, Yejin Choi, Jan Kautz

Nemotron-Labs-Diffusion: A Tri-Mode Language Model Unifying Autoregressive, Diffusion, and Self-Speculation Decoding

Yonggan Fu, Lexington Whalen, Abhinav Garg, Chengyue Wu, Maksim Khadkevich, Nicolai Oswald, Enze Xie, Daniel Egert, Sharath Turuvekere Sreenivas,, Shizhe Diao, Chenhan Yu, Ye Yu, Weijia Chen, Sajad Norouzi, Jingyu Liu, Shiyi Lan, Ligeng Zhu, Jin Wang, Jindong Jiang, Morteza Mardani, Mehran Maghoumi, Song Han, Ante Jukić, Nima Tajbakhsh, Jan Kautz, Pavlo Molchanov

Impact of Graphical Fidelity and Frame-Time Stutter in a First-Person Shooter Game

Samin Shahriar Tokey, Ben Boudaoud, Joohwan Kim, Josef Spjut, Peter Xenopoulos, Mark Claypool

SIGGRAPH

Test-Time Alignment for Large Language Models via Textual Model Predictive Control

Kuang-Da Wang, Teng-Ruei Chen, Yu Heng Hung, Guo-Xun Ko, Shuoyang Ding, Frank Wang, Huck Yang, Wen-Chih Peng, Ping-Chun Hsieh

ICLR

TimeOmni-1: Incentivizing Complex Reasoning with Time Series in Large Language Models

Tong Guan, Huck Yang, Sabato Marco Siniscalchi, Qingsong Wen, Ming Jin, Shirui Pan

ICLR

RLP: Reinforcement as a Pretraining Objective

Ali Hatamizadeh, Syeda Nahida Akter, Shrimai Prabhumoye, Jan Kautz, Mostofa Patwary, Mohammad Shoeybi, Bryan Catanzaro, Yejin Choi

ICLR

Short-time, Wavelet-inspired Mouse Submovement Detection

Auejin Ham, Ben Boudaoud

QCalEval: Benchmarking Vision-Language Models for Quantum Calibration Plot Understanding

Shuxiang Cao, Zijian Zhang, Abhishek Agarwal, Grace Bratrud, Niyaz R. Beysengulov, Daniel C. Cole, Alejandro Gomez Frieiro, Elena O. Glen, Hao Hsu, Gang Huang, Raymond Jow, Greshma Shaji, Tom Lubowe, Ligeng Zhu, Luis Mantilla Calderon, Nicola Pancotti, Joel Pendleton, Brandon Severin, Charles Etienne Staub, Sara Sussman, Antti Vepsäläinen, Neel Rajeshbhai Vora, Yilun Xu, Varinia Bernales, Daniel Bowring, Elica Kyoseva, Ivan Rungger, Giulia Semeghini, Sam Stanwyck, Timothy Costa, Alán Aspuru-Guzik, Krysta Svore