LlamaFlex: Many-in-One LLMs via Generalized Pruning and Weight Sharing

Ruisi Cai, Saurav Muralidharan, Hongxu (Danny) Yin, Zhangyang Wang, Jan Kautz, Pavlo Molchanov

April 2025

pdf

Type

Conference paper

Publication

International Conference on Learning Representations (ICLR)