A Simple Yet Effective Method for Non-Refusing Context Relevant Fine-grained Safety Steering in LLMs

Shaona Ghosh, Amrita Bhattacharjee, Yftah Ziser, Christopher Parisien

December 2025 Natural Language Processing

Type

Conference paper

Publication

EMNLP 2025 (Main)

Large Language Models Safety