Voicebox:Meta 的开创性语音人工智能

Meta 推出 Voicebox,并在生成式 AI 语音领域实现世界首创

Meta AI 研究人员利用 Voicebox 在生成人工智能领域取得了重大进展。 与之前的模型不同,Voicebox 可以泛化未经专门训练的语音生成任务。 这是一场最先进的表演。

Voicebox 是一种音频生成系统,可以生成高质量的音频剪辑。 它可以生成输出或修改现有样本。 它支持六种语言的语音合成、噪声去除、风格转换和样本生成。

过去,生成式人工智能语音模型需要使用精心挑选的训练数据对每项任务进行特定训练。 Voicebox 使用一种名为“流量匹配”的新技术,其性能优于扩散模型。 它比 VALL-E 等现有模型快达 20 倍,并且在英语文本转语音任务中取得了更好的结果。 Voicebox 在跨语言风格传输方面优于 YourTTS,将错误率从 10.9% 降低到 5.2%,并将音频相似度提高到 0.481。

来源和详细信息:
https://tech.hindustantimes.com/tech/news/meta-introduces-voicebox-does-a-first-on-generative-ai-speech-71687025962593.html

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注