Publications | Research

18 results found
High Performance Computing

Clear all

2021

GPS: A Global Publish-Subscribe Model for Multi-GPU Memory Management

Harini Muthukrishnan, Daniel Lustig, David Nellans, Thomas Wenisch

Best Paper nominee
IEEE Micro Top Picks in Computer Architecture (Honorable Mention)

EMOGI: Efficient Memory-access for Out-of-memory Graph-traversal in GPUs

Seung Won Min, Vikram Sharma Mailthody, Zaid Qureshi, Jinjun Xiong, Eiman Ebrahimi, Wen-mei Hwu

Large Graph Convolutional Network Training with GPU-Oriented Data Communication Architecture

Seung Won Min, Kun Wu, Sitao Huang, Mert Hidayetoglu, Jinjun Xiong, Eiman Ebrahimi, Deming Chen, Wen-mei Hwu

Suraksha: A Quantitative AV Safety Evaluation Framework to Analyze Safety Implications of Perception Design Choices

Hengyu Zhao, Siva Hari, Timothy Tsai, Michael B. Sullivan, Steve Keckler, Jishen Zhao

Efficient Multi-GPU Shared Memory via Automatic Optimization of Fine-Grained Transfers

Harini Muthukrishnan, David Nellans, Daniel Lustig, Jeffrey Fessler, Thomas Wenisch

Demystifying GPU Reliability: Comparing and Combining Beam Experiments, Fault Simulation, and Profiling

Fernando Fernandes dos Santos, Siva Hari, Pedro Martins Basso, Luigi Carro, Paolo Rech

Learning Sparse Matrix Row Permutations for Efficient SpMM on GPU Architectures

Atefeh Mehrabi, Donghyuk Lee, Niladrish Chatterjee, Danial J. Sorin, Benjamin C. Lee, Mike O'Connor

Large Graph Convolutional Network Training with GPU-Oriented Data Communication Architecture

Seung Won Min, Kun Wu, Sitao Huang, Mert Hidayetoglu, Jinjun Xiong, Eiman Ebrahimi, Deming Chen, Wen-mei Hwu

Scaling Implicit Parallelism via Dynamic Control Replication

Michael Bauer, Wonchan Lee, Elliott Slaughter, Zhihao Jia, Mario Di Renzo, Manolis Papadakis, Galen Shipman, Patrick McCormick, Michael Garland, Alex Aiken

2016

Tensor Contractions with Extended BLAS Kernels on CPU and GPU

Yang Shi, U. N. Niranjan, Animashree Anandkumar, Cris Cecka

vDNN: Virtualized Deep Neural Networks for Scalable, Memory-Efficient Neural Network Design.

Minsoo Rhu, Natalia Gimelshein, Jason Clemons, Arslan Zulfiqar, Steve Keckler

Approxilyzer: Towards A Systematic Framework for Instruction-Level Approximate Computing and its Application to Hardware Resiliency

Radha Venkatagiri, Abdulrahman Mahmoud, Siva Hari, Sarita Adve

All-Inclusive ECC: Thorough End-to-End Protection for Reliable Computer Memory

Jungrae Kim, Michael B. Sullivan, Sangkug Lym, Mattan Erez

S-Step and Communication-Avoiding Iterative Methods

Maxim Naumov

Selective GPU Caches to Eliminate CPU-GPU HW Cache Coherence

Neha Agarwal, David Nellans, Eiman Ebrahimi, Thomas F. Wenisch, John Danskin, Steve Keckler

Towards High Performance Paged Memory for GPUs

Tianhao Zheng, David Nellans, Arslan Zulfiqar, Mark Stephenson, Steve Keckler

A Case for Toggle-Aware Compression for GPU Systems

Gennady Pekhimenko, Evgeny Bolotin, Nandita Vijaykumar, Onur Mutlu, Todd C. Mowry, Steve Keckler

Parallel Spectral Graph Partitioning

Maxim Naumov, Timothy Moon

Filters

Research Areas

Events

2021

2016

Filters

Publication Year

Research Areas

Events

2021

2016