audio-image - a wangyujie0821 Collection

wangyujie0821 's Collections

audio-image

updated 8 days ago

Scaling Audio-Text Retrieval with Multimodal Large Language Models

Paper • 2602.18010 • Published Feb 20