Search

Zhehuai Chen

Investigating Safety Vulnerabilities of Large Audio-Language Models Under Speaker Emotional Variations
DeSTA2.5-Audio: Toward General-Purpose Large Audio Language Model with Self-Generated Cross-Modal Alignment
VoiceNoNG: High-Quality Speech Editing Model without Hallucinations
Audio Large Language Models Can Be Descriptive Speech Quality Evaluators
Detecting the Undetectable: Assessing the Efficacy of Current Spoof Detection Methods Against Seamless Speech Edits
Desta: Enhancing speech language models through descriptive speech-text alignment
GenTranslate: Large Language Models are Generative Multilingual Speech and Machine Translators