AudioSep官网链接地址:https://arxiv.org/abs/2108.03809
网站默认显示语言:英语
AudioSep 介绍
AudioSep是一种基于自然语言查询的先进音频源分离模型,通过文本编码器和分离模型两个关键组件实现。我们在大规模多模态数据集上进行了训练,并在音频处理、音频编辑等领域广泛评估其能力。AudioSep表现出强大的分离性能和令人印象深刻的零样本泛化能力,在音频事件分离、乐器分离和语音增强等任务上都具有显著优势。
AudioSep用户群体
适用于音频分离领域,可用于音频处理、音频编辑等领域
使用AudioSep分离音频中的吉他声音
使用AudioSep分离音频中的人声
使用AudioSep分离音频中的钢琴声音
AudioSep的核心功能
- 基于自然语言查询的音频源分离
- 支持开放领域音频概念分离
- 支持音频事件分离、乐器分离和语音增强
- 具有强大的分离性能和零样本泛化能力