基于自然语言查询的开放领域音频源分离模型

AudioSep

释放双眼，带上耳机，听听看~！

AudioSep官网链接地址：https://arxiv.org/abs/2108.03809

网站默认显示语言：英语

AudioSep 介绍

AudioSep是一种基于自然语言查询的先进音频源分离模型，通过文本编码器和分离模型两个关键组件实现。我们在大规模多模态数据集上进行了训练，并在音频处理、音频编辑等领域广泛评估其能力。AudioSep表现出强大的分离性能和令人印象深刻的零样本泛化能力，在音频事件分离、乐器分离和语音增强等任务上都具有显著优势。

AudioSep用户群体

适用于音频分离领域，可用于音频处理、音频编辑等领域

使用AudioSep分离音频中的吉他声音

使用AudioSep分离音频中的人声

使用AudioSep分离音频中的钢琴声音

AudioSep的核心功能

基于自然语言查询的音频源分离
支持开放领域音频概念分离
支持音频事件分离、乐器分离和语音增强
具有强大的分离性能和零样本泛化能力

本网站的内容主要来自互联网上的各种资源，仅供参考和信息分享之用，不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益，请联系我们，我们将尽快采取行动，包括删除或更正。

{{userData.name}}已认证

AudioSep

AudioSep 介绍

AudioSep用户群体

AudioSep的核心功能

Soundify

Audo Studio

GeoSpy.ai

即梦Dreamina

Globe Explorer

Luma Dream Machine

抖音即创

Motionshop

归档

{{userData.name}}已认证

AudioSep 介绍

AudioSep用户群体

AudioSep的核心功能

Soundify

Audo Studio

Soundify

Audiogest.app

Speechki ChatGPT Plugin

Coqui