AudioSep

释放双眼,带上耳机,听听看~!
基于自然语言查询的开放领域音频源分离模型

AudioSep官网链接地址:https://arxiv.org/abs/2108.03809

网站默认显示语言:英语

AudioSep 介绍

AudioSep是一种基于自然语言查询的先进音频源分离模型,通过文本编码器和分离模型两个关键组件实现。我们在大规模多模态数据集上进行了训练,并在音频处理、音频编辑等领域广泛评估其能力。AudioSep表现出强大的分离性能和令人印象深刻的零样本泛化能力,在音频事件分离、乐器分离和语音增强等任务上都具有显著优势。

AudioSep用户群体

适用于音频分离领域,可用于音频处理、音频编辑等领域

使用AudioSep分离音频中的吉他声音

使用AudioSep分离音频中的人声

使用AudioSep分离音频中的钢琴声音

AudioSep的核心功能

  • 基于自然语言查询的音频源分离
  • 支持开放领域音频概念分离
  • 支持音频事件分离、乐器分离和语音增强
  • 具有强大的分离性能和零样本泛化能力
本网站的内容主要来自互联网上的各种资源,仅供参考和信息分享之用,不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益,请联系我们,我们将尽快采取行动,包括删除或更正。
声音与音频编辑工具

Soundify

2024-1-1 18:10:50

声音与音频编辑工具

Audo Studio

2024-1-1 18:31:50

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索