资源分享:软件|网站|开源
VoxCPM |基于连续表征的多语言语音合成、创意音色设计与高保真声音克隆 一个无离散音频分词器(Tokenizer-Free)的语音合成系统,通过端到端的扩散自回归架构直接生成连续语音表征,绕过对音频的离散编码步骤,实现高度自然且富有表现力的语音合成。 🌍 30种语言语音合成 — 直接输入原始文本即可合成(支持语言详见下文),无需额外语言标签 🎨 音色设计 — 用自然语言描述(性别、年龄、音色、情绪、语速……)凭空创建全新音色,无需参考音频 🎛 可控声音克隆 — 从参考音频片段克隆任意声音,可叠加风格…