Publications

Qinghao Hu, Shang Yang, Junxian Guo, Xiaozhe Yao, Yujun Lin, Yuxian Gu, Han Cai, Chuang Gan, Ana Klimovic, Song Han (2025). Taming the Long-Tail: Efficient Reasoning RL Training with Adaptive Drafter. ASPLOS2026.

PDF Cite Code Project

Yesheng Liang, Haisheng Chen, Song Han, Zhijian Liu (2025). ParoQuant: Pairwise Rotation Quantization for Efficient Reasoning LLM Inference. ICLR2026.

PDF Cite Project

Wei Huang, Yi Ge, Shuai Yang, Yicheng Xiao, Huizi Mao, Yujun Lin, Hanrong Ye, Sifei Liu, Ka Chun Cheung, Hongxu Yin, Yao (Jason) Lu, Xiaojuan Qi, Song Han, Yukang Chen (2025). QeRL: Beyond Efficiency - Quantization-enhanced Reinforcement Learning for LLMs. ICLR2026.

Shuai Yang, Wei Huang, Ruihang Chu, Yicheng Xiao, Yuyang Zhao, Xianbang Wang, Muyang Li, Enze Xie, Ying-Cong Chen, Yao (Jason) Lu, Song Han, Yukang Chen (2025). LongLive: Real-time Interactive Long Video Generation. ICLR2026.

PDF Cite Code Project Video

Ruyi Xu, Guangxuan Xiao, Yukang Chen, Liuning He, Kelly Peng, Yao (Jason) Lu, Song Han (2025). StreamingVLM: Real-Time Understanding for Infinite Video Streams. ICLR2026.

PDF Cite Code Project Slides Demo

Chengyue Wu, Hao Zhang, Shuchen Xue, Shizhe Diao, Yonggan Fu, Zhijian Liu, Pavlo Molchanov, Ping Luo, Song Han, Enze Xie (2025). Fast-dLLM v2: Efficient Block-Diffusion LLM. ICLR2026.

Wenkun He, Yuchao Gu, Junyu Chen, Dongyun Zou, Yujun Lin, Zhekai Zhang, Haocheng Xi, Muyang Li, Ligeng Zhu, Jincheng YU, Junsong Chen, Enze Xie, Song Han, Han Cai (2025). DC-Gen: Post-Training Diffusion Acceleration with Deeply Compressed Latent Space.

PDF Cite Code Project

An-Chieh Cheng, Yang Fu, Yukang Chen, Zhijian Liu, Xiaolong Li, Subhashree Radhakrishnan, Song Han, Yao (Jason) Lu, Jan Kautz, Pavlo Molchanov, Hongxu Yin, Xiaolong Wang, Sifei Liu (2025). 3D Aware Region Prompted Vision Language Model. ICLR2026.

PDF Cite Code Dataset Project

Yuxian Gu, Qinghao Hu, Haocheng Xi, Junyu Chen, Shang Yang, Song Han, Han Cai (2025). Jet-Nemotron: Efficient Language Model with Post Neural Architecture Search. NeurIPS2025.

PDF Cite Code Project Video

Junyu Chen, Dongyun Zou, Wenkun He, Junsong Chen, Enze Xie, Song Han, Han Cai (2025). DC-AE 1.5: Accelerating Diffusion Model Convergence with Structured Latent Space. ICCV2025.

PDF Code Project Demo

Yukang Chen, Wei Huang, Baifeng Shi, Qinghao Hu, Hanrong Ye, Ligeng Zhu, Zhijian Liu, Pavlo Molchanov, Jan Kautz, Xiaojuan Qi, Sifei Liu, Hongxu Yin, Yao (Jason) Lu, Song Han (2025). Scaling RL to Long Videos. NeurIPS2025.

PDF Cite Code Video

Yecheng Wu, Han Cai, Junyu Chen, Zhuoyang Zhang, Enze Xie, Jincheng YU, Junsong Chen, Jinyi Hu, Yao (Jason) Lu, Song Han (2025). DC-AR: Efficient Masked Autoregressive Image Generation with Deep Compression Hybrid Tokenizer. ICCV2025.

PDF Code Project Demo

Zhuoyang Zhang, Luke J. Huang, Chengyue Wu, Shang Yang, Kelly Peng, Yao (Jason) Lu, Song Han (2025). Locality-aware Parallel Decoding for Efficient Autoregressive Image Generation. ICLR2026.

Xingyang Li, Muyang Li, Tianle Cai, Haocheng Xi, Shuo Yang, Yujun Lin, Lvmin Zhang, Songlin Yang, Jinbo Hu, Kelly Peng, Maneesh Agrawala, Ion Stoica, Kurt Keutzer, Song Han (2025). Radial Attention: $\mathcal{O}(n\log n)$ Sparse Attention with Energy Decay for Long Video Generation. NeurIPS2025.

PDF Cite Code Project

Samir Khaki, Xiuyu Li, Junxian Guo, Ligeng Zhu, Chenfeng Xu, Konstantinos N. Plataniotis, Amir Yazdanbakhsh, Kurt Keutzer, Song Han, Zhijian Liu (2025). SparseLoRA: Accelerating LLM Fine-Tuning with Contextual Sparsity. ICML2025.

PDF Cite Code Project Slides

Chengyue Wu, Hao Zhang, Shuchen Xue, Zhijian Liu, Shizhe Diao, Ligeng Zhu, Ping Luo, Song Han, Enze Xie (2025). Fast-dLLM: Training-free Acceleration of Diffusion LLM by Enabling KV Cache and Parallel Decoding. ICLR2026.

PDF Cite Code Project Demo

Shuo Yang, Haocheng Xi, Yilong Zhao, Muyang Li, Jintao Zhang, Han Cai, Yujun Lin, Xiuyu Li, Chenfeng Xu, Kelly Peng, Jianfei Chen, Song Han, Kurt Keutzer, Ion Stoica (2025). Sparse VideoGen2: Accelerate Video Generation with Sparse Attention via Semantic-Aware Permutation. NeurIPS2025.

Qingqing Zhao, Yao (Jason) Lu, Moo Jin Kim, Zipeng Fu, Zhuoyang Zhang, Yecheng Wu, Max Li, Qianli Ma, Song Han, Chelsea Finn, Ankur Handa, Ming-Yu Liu, Donglai Xiang, Gordon Wetzstein, Tsung-Yi Lin (2025). CoT-VLA: Visual Chain-of-Thought Reasoning for Vision-Language-Action Models. CVPR2025.

PDF Cite Project

Baifeng Shi, Boyi Li, Han Cai, Yao (Jason) Lu, Sifei Liu, Marco Pavone, Jan Kautz, Song Han, Trevor Darrell, Pavlo Molchanov, Hongxu Yin (2025). PS3: Vision Pre-Training at 4K Resolution. CVPR2025.

PDF Cite Code Project Weights

Ruyi Xu, Guangxuan Xiao, Haofeng Huang, Junxian Guo, Song Han (2025). XAttention: Block Sparse Attention with Antidiagonal Scoring. ICML2025.

PDF Cite Code Slides

Junsong Chen, Shuchen Xue, Yuyang Zhao, Jincheng YU, Sayak Paul, Junyu Chen, Han Cai, Song Han, Enze Xie (2025). SANA-Sprint: One-Step Diffusion with Continuous-Time Consistency Distillation. ICCV2025.

PDF Cite Code Project

Yecheng Wu, Zhuoyang Zhang, Junyu Chen, Haotian Tang, Dacheng Li, Yunhao Fang, Ligeng Zhu, Enze Xie, Hongxu Yin, Li Yi, Song Han, Yao (Jason) Lu (2025). VILA-U: a Unified Foundation Model Integrating Visual Understanding and Generation. ICLR2025.

PDF Cite Code Project Model Demo

Chaofan Lin, Jiaming Tang, Shuo Yang, Hanshuo Wang, Tian Tang, Boyu Tian, Ion Stoica, Song Han, Mingyu Gao (2025). Twilight: Adaptive Attention Sparsity with Hierarchical Top-$p$ Pruning. NeurIPS2025.

PDF Cite Code Poster Slides

Haocheng Xi, Shuo Yang, Yilong Zhao, Chenfeng Xu, Muyang Li, Xiuyu Li, Yujun Lin, Han Cai, Jintao Zhang, Dacheng Li, Jianfei Chen, Ion Stoica, Kurt Keutzer, Song Han (2025). Sparse VideoGen: Accelerating Video Diffusion Transformers with Spatial-Temporal Sparsity. ICML2025.

PDF Cite Code Project

Enze Xie, Junsong Chen, Yuyang Zhao, Jincheng YU, Ligeng Zhu, Yujun Lin, Zhekai Zhang, Muyang Li, Junyu Chen, Han Cai, Bingchen Liu, Daquan Zhou, Song Han (2025). SANA 1.5: Efficient Scaling of Training-Time and Inference-Time Compute in Linear Diffusion Transformer. ICML2025.

PDF Cite Code Project

Muyang Li, Yujun Lin, Zhekai Zhang, Tianle Cai, Xiuyu Li, Junxian Guo, Enze Xie, Chenlin Meng, Jun-Yan Zhu, Song Han (2024). SVDQuant: Absorbing Outliers by Low-Rank Components for 4-Bit Diffusion Models. ICLR2025.

PDF Cite Code Project Video Demo Blog

Haocheng Xi, Han Cai, Ligeng Zhu, Yao (Jason) Lu, Kurt Keutzer, Jianfei Chen, Song Han (2024). COAT: Compressing Optimizer states and Activation for Memory-Efficient FP8 Training. ICLR2025.

PDF Cite Code Project Demo

Enze Xie, Junsong Chen, Junyu Chen, Han Cai, Haotian Tang, Yujun Lin, Zhekai Zhang, Muyang Li, Ligeng Zhu, Yao (Jason) Lu, Song Han (2024). SANA: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformer. ICLR2025.

PDF Cite Code Project MIT Project Demo

Haotian Tang, Yecheng Wu, Shang Yang, Enze Xie, Junsong Chen, Junyu Chen, Zhuoyang Zhang, Han Cai, Yao (Jason) Lu, Song Han (2024). HART: Efficient Visual Generation with Hybrid Autoregressive Transformer. ICLR2025.

PDF Cite Code Project Demo

Guangxuan Xiao, Jiaming Tang, Jingwei Zuo, Junxian Guo, Shang Yang, Haotian Tang, Yao Fu, Song Han (2024). DuoAttention: Efficient Long-Context LLM Inference with Retrieval and Streaming Heads. ICLR2025.

PDF Cite Code Project

Junyu Chen, Han Cai, Junsong Chen, Enze Xie, Shang Yang, Haotian Tang, Muyang Li, Yao (Jason) Lu, Song Han (2024). Deep Compression Autoencoder for Efficient High-Resolution Diffusion Models. ICLR2025.

PDF Cite Code Project

Song Han, Xingyu Liu, Huizi Mao, Jing Pu, Ardavan Pedram, Mark A. Horowitz, William J. Dally (2023). Retrospective: EIE: Efficient Inference Engine on Sparse and Compressed Neural Network.

Xuanyao Chen, Zhijian Liu, Haotian Tang, Li Yi, Hang Zhao, Song Han (2023). SparseViT: Revisiting Activation Sparsity for Efficient High-Resolution Vision Transformer. CVPR.

PDF Cite Code Project Poster

Zhijian Liu, Xinyu Yang, Haotian Tang, Shang Yang, Song Han (2023). FlatFormer: Flattened Window Attention for Efficient Point Cloud Transformer. CVPR.

PDF Cite Code Project Poster

Zhijian Liu, Haotian Tang, Alexander Amini, Xinyu Yang, Huizi Mao, Daniela L. Rus, Song Han (2022). BEVFusion: Multi-Task Multi-Sensor Fusion with Unified Bird's-Eye View Representation. ICRA2023.

PDF Cite Code Project Poster Video