Voice Engine官网链接地址:https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voices
网站默认显示语言:英语
Voice Engine 介绍
Voice Engine是一种高级语音合成模型,只需15秒的语音样本即可生成与原始说话人极为相似的自然语音。该模型广泛应用于教育、娱乐、医疗等领域,可为产品提供朗读功能、实现多语种语音翻译、赋予独特语音特征等。其优势在于所需语音样本较少、生成语音质量高、支持多语种。Voice Engine目前处于小规模预览阶段,OpenAI正在探讨其潜在应用和伦理挑战。
Voice Engine用户群体
为教育产品提供朗读功能,为视频和播客实现多语种语音翻译,为非语言人群赋予独特语音特征,为临床病例恢复患者原有语音
教育公司Age of Learning使用Voice Engine为儿童教育内容生成自然语音,并与GPT-4模型配合实现个性化语音交互。视觉内容平台HeyGen利用Voice Engine为企业客户的营销视频实现多语种语音翻译,保留原声说话人的语音特征。通信辅助应用Livox使用Voice Engine为失语症患者提供独特而非机械般的语音,让他们选择最能代表自我的声音进行交流。
Voice Engine的核心功能
- 基于少量语音样本生成逼真语音,支持多种语言和口音,保留原声说话人的语音特征,支持实时个性化语音交互