Publications | Research

Balakumar Sundaralingam, Siva Hari, Adam Fishman, Caelan Garrett, Karl Van Wyk, Valts Blukis, Alexander Millane, Helen Oleynikova, Ankur Handa, Fabio Ramos, Nathan Ratliff, Dieter Fox

Parsimony: Enabling SIMD/Vector Programming in Standard Compiler Flows

Vijay Kandiah, Daniel Lustig, Oreste Villa, David Nellans, Nikos Hardavellas

A 95.6-TOPS/W Deep Learning Inference Accelerator With Per-Vector Scaled 4-bit Quantization in 5 nm

Ben Keller, Rangharajan Venkatesan, Steve Dai, Stephen Tell, Brian Zimmer, Charbel Sakr, William Dally, Tom Gray, Brucek Khailany

2022

HEAT: Hardware-Efficient Automatic Tensor Decomposition for Transformer Compression

Jiaqi Gu, Ben Keller, Jean Kossaifi, Anima Anandkumar, Brucek Khailany, David Z. Pan

NeurIPS

Spotlight Paper

LNS-Madam: Low-Precision Training in Logarithmic Number System Using Multiplicative Weight Update

Jiawei Zhao, Steve Dai, Rangharajan Venkatesan, Brian Zimmer, Mustafa Ali, Ming-Yu Liu, Brucek Khailany, William Dally, Anima Anandkumar

Towards Precision-Aware Fault Tolerance Approaches for Mixed-Precision Applications

Bo Fang, Siva Hari, Timothy Tsai, Xinyi Li, Ganesh Gopalakrishnan, Ignacio Laguna, Kevin Barker, Ang Li

The Implications of Page Size Management on Graph Analytics

Aninda Manocha, Zi Yan, Esin Tureci, Juan Luis Aragón, David Nellans, Margaret Martonosi

Demystifying Map Space Exploration for NPUs

Sheng-Chun Kao, Angshuman Parashar, Po-An Tsai, Tushar Krishna

Sparseloop: An Analytical Approach to Sparse Tensor Accelerator Modeling

Yannan Nellie Wu, Po-An Tsai, Angshuman Parashar, Vivienne Sze, Joel Emer

Distinguished Artifact award

SEC-BADAEC: An Efficient ECC With No Vacancy for Strong Memory Protection

Yuseok Song, Sangjae Park, Michael B. Sullivan, Jungrae Kim

Self Adaptive Reconfigurable Arrays (SARA): Learning Flexible GEMM Accelerator Configuration and Mapping-space using ML

Ananda Samajdar, Eric Qin, Michael Pellauer, Tushar Krishna

Zhuyi: Perception Processing Rate Estimation for Safety in Autonomous Vehicles

Yu-Shun Hsiao, Siva Hari, Michał Filipiuk, Timothy Tsai, Michael B. Sullivan, Vijay Janapa Reddi, Vasu Singh, Steve Keckler

Exploiting Temporal Data Diversity for Detecting Safety-critical Faults in AV Compute Systems

Saurabh Jha, Shengkun Cui, Timothy Tsai, Siva Hari, Michael B. Sullivan, Zbigniew T. Kalbarczyk, Steve Keckler, Ravishankar K. Iyer

Ruby: Improving Hardware Efficiency for Tensor Algebra Accelerators Through Imperfect Factorization

Mark Horeni, Pooria Taheri, Po-An Tsai, Angshuman Parashar, Joel Emer, Siddharth Joshi

Mixed-Proxy Extensions for the NVIDIA PTX Memory Consistency Model

Daniel Lustig, Simon Cooksey, Olivier Giroux

IEEE Micro Top Picks in Computer Architecture (Honorable Mention)

SIMD^2: A Generalized Matrix Instruction Set for Accelerating Tensor Computation beyond GEMM

Yunan Zhang, Po-An Tsai, Hung-Wei Tseng

A Formalism of DNN Accelerator Flexibility

Sheng-Chun Kao, Hyoukjun Kwon, Michael Pellauer, Angshuman Parashar, Tushar Krishna

Learning A Continuous and Reconstructible Latent Space for Hardware Accelerator Design

Qijing Jenny Huang, Charles Hong, John Wawrzynek, Mahesh Subedar, Yakun Sophia Shao

Zhuyi: Perception Processing Rate Estimation for Safety in Autonomous Vehicles

Yu-Shun Hsiao, Siva Hari, Michał Filipiuk, Timothy Tsai, Michael B. Sullivan, Vijay Janapa Reddi, Vasu Singh, Steve Keckler

Saving PAM4 Bus Energy with SMOREs: Sparse Multi-level Opportunistic Restricted Encodings

Mike O'Connor, Donghyuk Lee, Niladrish Chatterjee, Michael B. Sullivan, Steve Keckler

Improving Locality of Irregular Updates with Hardware Assisted Propagation Blocking

Vignesh Balaji, Brandon Lucia

Best Paper nominee

Characterizing and Mitigating Soft Errors in GPU DRAM

Michael B. Sullivan, Nirmal R. Saxena, Mike O'Connor, Donghyuk Lee, Paul Racunas, Saurabh Hukerikar, Timothy Tsai, Siva Kumar Sastry Hari, Stephen W. Keckler

Filters

Research Areas

Events

2026

2025

2023

2022

Filters

Publication Year

Research Areas

Events

2026

2025

2023

2022