tsinghua-ee
/

SALMONN

Automatic Speech Recognition

automatic-audio-captioning

automatic-speech-translation

music-captioning

audio-based-storytelling

speech-audio-coreasoning

auditory understanding

Model card Files Files and versions Community

Resources

View closed (1)

Really interesting work, surprised it didn't get more attention for it's diarization capabilities

#1 opened 12 months ago by