Publications | Research

2025

GauRast: Enhancing GPU Triangle Rasterizers to Accelerate 3D Gaussian Splatting

Georgia Tech, Ben Keller, Yingyan Celine Lin, Brucek Khailany

GEM: GPU-Accelerated Emulator-Inspired RTL Simulation

Zizheng Guo, Yanqing Zhang, Haoxing (Mark) Ren

Best Paper Award Nomination at DAC, 2025

Task-Based Tensor Computations on Modern GPUs

Rohan Yadav, Michael Garland, Alex Aiken, Michael Bauer

PLDI

MambaVision: A Hybrid Mamba-Transformer Vision Backbone

Ali Hatamizadeh, Jan Kautz

CVPR

Marco: Configurable Graph-Based Task Solving and Multi-AI Agents Framework for Hardware Design

Chia-Tung (Mark) Ho, Jing Gong, Yunsheng Bai, Chenhui Deng, Haoxing (Mark) Ren, Brucek Khailany

Beyond the Buzz: A Pragmatic Take on Inference Disaggregation

Tiyasa Mitra, Ritika Borkar, Nidhi Bhatia, Ramon Matas, Shivam Raj, Dheevatsa Mudigere, Ritchie Zhao, Maximilian Golub, Arpan Dutta, Sailaja Madduri, Dharmesh Jani, Brian Pharris, Bita Darvish Rouhani

SLIM: One-shot Quantization and Sparsity with Low-rank Approximation for LLM Weight Compression

Mohammad Mozaffari , Amir Yazdanbakhsh, Maryam Mehri Dehnavi

ICML

Adaptive Algebraic Reuse of Reordering in Cholesky Factorizations with Dynamic Sparsity Patterns

Behrooz Zarebavani, Danny Kaufman, David Levin, Maryam Mehri Dehnavi

SIGGRAPH

Inference-Time Policy Steering through Human Interactions

Yanwei Wang, Lirui Wang, Yilun Du, Balakumar Sundaralingam, Xuning Yang, Yu-Wei Chao, Claudia Pérez D’Arpino , Dieter Fox, Julie Shah

ICRA

Score Distillation Sampling for Audio: Source Separation, Synthesis, and Beyond

Jessie Richter-Powell, Antonio Torralba, Jonathan Lorraine

ICML

Fugatto 1 - Foundational Generative Audio Transformer Opus 1

Rafael Valle, Rohan Badlani, Zhifeng Kong, Sang-gil Lee, Arushi Goel, Sungwon Kim, Joao Felipe Santos, Shuqi Dai, Siddharth Gururani, Aya AIJa'fari, Alex Liu, Kevin Shih, Wei Ping, Huck Yang, Bryan Catanzaro

ICLR

Gated Delta Networks: Improving Mamba2 with Delta Rule

Songlin Yang, Jan Kautz, Ali Hatamizadeh

ICLR

LongVILA: Scaling Long-Context Visual Language Models for Long Videos

Yukang Chen, Fuzhao Xue, Dacheng Li, Qinghao Hu, Ligeng Zhu, Xiuyu Li, Yunhao Fang, Haotian Tang, Shang Yang, Zhijian Liu, Ethan He, Hongxu Yin, Pavlo Molchanov, Jan Kautz, Linxi Fan, Yuke Zhu, Yao Lu (Jason), Song Han

ICLR

Audio Large Language Models Can Be Descriptive Speech Quality Evaluators

Chen Chen, Yuchen Hu, Siyin Wang, Helin Wang, Zhehuai Chen, Chao Zhang, Huck Yang, EngSiong Chng

ICLR

UniWav: Towards Unified Pre-training for Speech Representation Learning and Generation

Alexander H. Liu, Sang-gil Lee, Huck Yang, Yuan Gong, Frank Wang, James R. Glas, Rafael Valle

ICLR

Toward Understanding Display Size for FPS Esports Aiming

Arjun Madhusudan, Josef Spjut, Benjamin Watson, Seth Schneider, Ben Boudaoud, Joohwan Kim

Towards Neural Scaling Laws for Time Series Foundation Models

Qingren Yao, Huck Yang, Renhe Jiang, Ming Jin, Shirui Pan

ICLR

Modeling Visually-Guided Aim-and-Shoot behavior in First-Person Shoters

June-Seop Yoon, Hee-Seung Moon, Ben Boudaoud, Josef Spjut, Iuri Frosio, Byungjoo Lee, Joohwan Kim

Composing Distributed Computations Through Task and Kernel Fusion

Rohan Yadav, Shiv Sundrum, Wonchan Lee, Michael Garland, Michael Bauer, Alex Aiken, Fredrik Kjolstad

Automatic Tracing in Task-Based Runtime Systems

Rohan Yadav, Michael Bauer, David Broman, Michael Garland, Alex Aiken, Fredrik Kjolstad

Pushing the Limits? Frame Rate Benefits to Players for up to 500 Hz in First Person Shooter Games

Samin Shahriar Tokey, Ben Boudaoud, Joohwan Kim, Josef Spjut, Mark Claypool

Cosmos Transfer 1: World-to-World Transfer with Adaptive Multi-Control for Physical AI

Ming-Yu Liu

Cosmos-Reason 1: From Physical AI Common Sense to Embodied Decisions

Tsung-Yi Lin, Ming-Yu Liu

NVIDIA Isaac GR00T N1: An Open Foundation Model for Humanoid Robots

Yuke Zhu, Linxi "Jim" Fan, NVIDIA GEAR Team

LLaMA-Mesh: Unifying 3D Mesh Generation with Language Models

Zhengyi Wang, Jonathan Lorraine, Yikai Wang, Hang Su, Jun Zhu, Sanja Fidler, Xiaohui Zeng

Multi-student Diffusion Distillation for Better One-step Generators

Yanke Song, Jonathan Lorraine, Weili Nie, Karsten Kreis, James Lucas

ICML

Spatio-Temporal Context Prompting for Zero-Shot Action Detection

Wei-Jhe Huang, Min-Hung Chen, Shang-Hong Lai

Semantic Prompt Learning for Weakly-Supervised Semantic Segmentation

Ci-Siang Lin, Chien-Yi Wang, Frank Wang, Min-Hung Chen

CorrFill: Enhancing Faithfulness in Reference-based Inpainting with Correspondence Guidance in Diffusion Models

Kuan-Hung Liu, Cheng-Kun Yang, Min-Hung Chen, Yu-Lun Liu, Yen-Yu Lin

Principles and guidelines for evaluating social robot navigation algorithms

Anthony Francis*, Claudia Pérez D’Arpino*, CHENGSHU LI, FEI XIA, ALEXANDRE ALAHI, RACHID ALAMI, ANIKET BERA, ABHIJAT BISWAS, JOYDEEP BISWAS, ROHAN CHANDRA, HAO-TIEN LEWIS CHIANG, MICHAEL EVERETT, SEHOON HA, JUSTIN HART, JONATHAN P. HOW, HARESH KARNAN, TSANG-WEI EDWARD LEE, LUIS J. MANSO, REUTH MIRSKY, SÖREN PIRK, PHANI TEJA SINGAMANENI, PETER STONE, ADA V. TAYLOR, PETER TRAUTMAN, NATHAN TSOI, MARYNEL VÁZQUEZ, XUESU XIAO, PENG XU, NAOKI YOKOYAMA, ALEXANDER TOSHEV, ROBERTO MARTÍN-MARTÍN

eXtended Reality and Artificial Intelligence in Medicine and Rehabilitation

Tomas Krilavičius, Lucio Tommaso De Paolis, Valerio De Luca, Josef Spjut

Energy-Based Diffusion Language Models for Text Generation

Minkai Xu, Tomas Geffner, Karsten Kreis, Weili Nie, Yilun Xu, Jure Leskovec, Stefano Ermon, Arash Vahdat

ICLR

Filters

Research Areas

Events

2025

Filters

Publication Year

Research Areas

Events

2025