<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet href="/rss.xsl" type="text/xsl"?><rss version="2.0" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>VoxCPM | 全网优质资源汇总✨</title><description>收集全网优质资源，精选热门GitHub项目、开源工具、实用软件、在线网站与效率工具，持续整理可用、有价值的项目和应用推荐。</description><link>https://broadcastchannel-hub.pages.dev</link><item><title>VoxCPM |基于连续表征的多语言语音合成、创意音色设计与高保真声音克隆一个无离散音频分词器（Tokenizer-Free）的语音合成系统，通过端到端的扩散自回归架构直接生成连续语音表征，绕过对音频的离散编码步骤，实现高度自然且富有表现力的语音合成</title><link>https://broadcastchannel-hub.pages.dev/posts/txwl666-8351</link><guid isPermaLink="true">https://broadcastchannel-hub.pages.dev/posts/txwl666-8351</guid><pubDate>Thu, 04 Jun 2026 05:10:19 GMT</pubDate><content:encoded>&lt;div&gt;
      
        &lt;img src=&quot;/static/https://cdn5.telesco.pe/file/EMWS4oQJKxpwkRClDqhTj5lUiAQtFtJ8u5SLkX2eCei9uUDYyyvEjEw1UXvtmdXnPAy_roYRopw9BkRSf3DF1ClG6PX3AshEf6VTpVa9-3vBZ1N6rNn2kGVz9G1ZOcw61dE8rntxug5CoUsoynpy0FziZQ8bK7vWJMlAQkEsMnFbwe5LPciwdAJ-OGQ0a34aylcZghpz1lrp1ZmhJUOVyBqVwj-zMya_RdOCVLZHjh-S36R0w9XJdyGEBZetABeTK8zYUIs_KGZvWCGtNhTMHGYtumuQ9aVDO7HCVBksxfSl7G9eE6KztLHAnnuVIe1-s-RGwUM8kaUOsA7w6ite5A.jpg&quot; alt=&quot;VoxCPM |基于连续表征的多语言语音合成、创意音色设计与高保真声音克隆一个无离散音频分词器（Tokenizer-Free）的语音合成系统，通过端到端的扩散自回归架构直接生成连续语音表征，绕过对音频的离散编码步骤，实现高度自然且富有表现力的语音合成&quot; width=&quot;800&quot; height=&quot;533&quot; loading=&quot;eager&quot; /&gt;
      
      &lt;div&gt;
        
        ×
        &lt;div&gt;
          
        &lt;/div&gt;
      &lt;/div&gt;
    &lt;/div&gt;&lt;mark&gt;&lt;b&gt;VoxCPM&lt;/b&gt;&lt;/mark&gt;&lt;b&gt; |基于连续表征的多语言语音合成、创意音色设计与高保真声音克隆&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;一个&lt;b&gt;无离散音频分词器&lt;/b&gt;（Tokenizer-Free）的语音合成系统，通过端到端的&lt;b&gt;扩散自回归架构&lt;/b&gt;直接生成连续语音表征，绕过对音频的离散编码步骤，实现高度自然且富有表现力的语音合成。&lt;br /&gt;&lt;div&gt;
      
      &lt;div&gt;&lt;i&gt;&lt;b&gt;🌍&lt;/b&gt;&lt;/i&gt; &lt;b&gt;30种语言语音合成&lt;/b&gt; — 直接输入原始文本即可合成（支持语言详见下文），无需额外语言标签&lt;br /&gt;&lt;i&gt;&lt;b&gt;🎨&lt;/b&gt;&lt;/i&gt; &lt;b&gt;音色设计&lt;/b&gt; — 用自然语言描述（性别、年龄、音色、情绪、语速……）凭空创建全新音色，无需参考音频&lt;br /&gt;&lt;i&gt;&lt;b&gt;🎛&lt;/b&gt;&lt;/i&gt; &lt;b&gt;可控声音克隆&lt;/b&gt; — 从参考音频片段克隆任意声音，可叠加风格指令控制情绪、语速和表现力，同时保持原始音色&lt;br /&gt;&lt;i&gt;&lt;b&gt;🎙&lt;/b&gt;&lt;/i&gt; &lt;b&gt;极致克隆&lt;/b&gt; — 提供参考音频及其文本内容，模型接着参考音频进行无缝续写，从而精准还原声音细节特征（与 VoxCPM1.5 一致）&lt;br /&gt;&lt;i&gt;&lt;b&gt;🔊&lt;/b&gt;&lt;/i&gt; &lt;b&gt;48kHz 高质量音频&lt;/b&gt; — 输入 16kHz 参考音频，通过 AudioVAE V2 的非对称编解码设计直接输出 48kHz 高质量音频，内置超分能力&lt;br /&gt;&lt;i&gt;&lt;b&gt;🧠&lt;/b&gt;&lt;/i&gt; &lt;b&gt;语境感知合成&lt;/b&gt; — 根据文本内容自动推断合适的韵律和表现力&lt;br /&gt;&lt;i&gt;&lt;b&gt;⚡️&lt;/b&gt;&lt;/i&gt; &lt;b&gt;实时流式合成&lt;/b&gt; — 在 NVIDIA RTX 4090 上 RTF 低至 ~0.3，通过 Nano-vLLM 或 vLLM-Omni（官方 vLLM 全模态服务，原生支持 VoxCPM2，提供 PagedAttention 与 OpenAI 兼容 API）加速后可达 ~0.13&lt;br /&gt;&lt;i&gt;&lt;b&gt;📜&lt;/b&gt;&lt;/i&gt; &lt;b&gt;完全开源，商用就绪&lt;/b&gt; — 权重和代码基于 Apache-2.0 协议发布，免费商用&lt;/div&gt;
      &lt;span&gt;Expand hidden content&lt;/span&gt;
    &lt;/div&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;https://github.com/OpenBMB/VoxCPM/blob/main/README_zh.md&quot; target=&quot;_blank&quot;&gt;项目地址&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23%E5%BC%80%E6%BA%90&quot;&gt;#开源&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%A3%B0%E9%9F%B3%E5%85%8B%E9%9A%86&quot;&gt;#声音克隆&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23AI%E8%AF%AD%E9%9F%B3&quot;&gt;#AI语音&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E6%9C%AC%E5%9C%B0%E9%83%A8%E7%BD%B2&quot;&gt;#本地部署&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23VoxCPM&quot;&gt;#VoxCPM&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E8%AF%AD%E9%9F%B3%E5%90%88%E6%88%90&quot;&gt;#语音合成&lt;/a&gt;</content:encoded></item></channel></rss>