Skip to main content
全网优质资源汇总✨

Search: #语言

  1. VoxCPM |基于连续表征的多语言语音合成、创意音色设计与高保真声音克隆

    一个无离散音频分词器(Tokenizer-Free)的语音合成系统,通过端到端的扩散自回归架构直接生成连续语音表征,绕过对音频的离散编码步骤,实现高度自然且富有表现力的语音合成。
    🌍 30种语言语音合成 — 直接输入原始文本即可合成(支持语言详见下文),无需额外语言标签
    🎨 音色设计 — 用自然语言描述(性别、年龄、音色、情绪、语速……)凭空创建全新音色,无需参考音频
    🎛 可控声音克隆 — 从参考音频片段克隆任意声音,可叠加风格指令控制情绪、语速和表现力,同时保持原始音色
    🎙 极致克隆 — 提供参考音频及其文本内容,模型接着参考音频进行无缝续写,从而精准还原声音细节特征(与 VoxCPM1.5 一致)
    🔊 48kHz 高质量音频 — 输入 16kHz 参考音频,通过 AudioVAE V2 的非对称编解码设计直接输出 48kHz 高质量音频,内置超分能力
    🧠 语境感知合成 — 根据文本内容自动推断合适的韵律和表现力
    ⚡️ 实时流式合成 — 在 NVIDIA RTX 4090 上 RTF 低至 ~0.3,通过 Nano-vLLM 或 vLLM-Omni(官方 vLLM 全模态服务,原生支持 VoxCPM2,提供 PagedAttention 与 OpenAI 兼容 API)加速后可达 ~0.13
    📜 完全开源,商用就绪 — 权重和代码基于 Apache-2.0 协议发布,免费商用


    项目地址

    #开源 #声音克隆 #AI语音 #本地部署 #VoxCPM #语音合成
  2. #语音克隆 #AI语音 #AI
    X Voice 一键 AI 语音克隆工具使用指南与功能介绍
    **X-Voice**是一款基于流程匹配的多语言文本转语音系统,使一名说话者能够使用30种语言。 环境依赖python,支持跨平台使用,优先N卡使用 ### **安装 X-Voice** 检查你的 ESpeak-ng 安装: 如果找不到,先运行 。 开源:https://github.com/sunnyxrxrx/X-Voice 网盘链接:https://pan.quark.cn/s/ecc563877898
    📢关注频道:@quanshoulu
    🎁访问主页: www.noisework.cn
  3. 🔁 VibeVoice
    📦 开源项目 | GitHub | AI语音生成 + 识别


    ➤ 长音频识别|支持最长60分钟语音转文字(ASR)
    ➤ 结构化转录|自动识别说话人 + 时间戳 + 内容
    ➤ 多人语音生成|支持最多4人对话语音(TTS)
    ➤ 超长语音|可生成最长约90分钟连续音频
    ➤ 实时语音|支持低延迟流式TTS输出
    ➤ 多语言支持|覆盖50+语言识别能力
    ➤ 开源研究|适合开发与语音AI实验


    🌐 项目:
    https://github.com/microsoft/VibeVoice

    ———— 商务合作————

    📂 #AI工具 #语音AI #开源项目 #TTS #ASR
    📁 Windows / 开发工具
  4. 🔰 Beelinguapp Language Audiobook v3.247 (Premium)

    ━━━━━━━━━━━━━━━━

    📚 应用简介:

    双语对照语言学习应用
    通过有声读物提升听力与阅读能力
    支持多语言同步阅读


    💠 Mod 信息:

    ◉ Premium 功能已解锁
    ◉ AOSP 兼容 / 无需 Google 服务
    ◉ CPU 架构:Universal
    ◉ 支持多语言
    ◉ 已移除所有调试信息

    📢 频道 | 💬 群组 | 📬 投稿 | 📨 商务

    #Beelinguapp #语言学习 #Audiobook #Premium #Android
  5. 🎙 LazyTyper | 懒人打字神器,基于 Whisper 的语音输入法

    🔥 还在为了打字手酸?这款体积仅几 MB 的小工具,利用 OpenAI Whisper 模型,让你的语音转文字快如闪电!

    💎 核心亮点:

    超高准确率: 🧠 基于强大的 Whisper 模型,识别准确率高达 90% 以上。
    多语言混输: 🌍 真正支持中、英、日、韩无缝混合说,再也不用手动切换语言。
    极致轻量化: 🪶 体积仅个位数 MB,内存占用极低,旧电脑也能跑得飞起。
    完全免费: 🆓 支持 Windows & macOS 双平台,无内购,无广告。

    📢 社区反馈:
    在 V2EX 论坛引起热议,网友评价极高,被称为“只有几M的生产力怪兽”。

    📥 官网下载 (Win/Mac)
    🔗 查看 V2EX 原帖讨论

    频道 | 💬 群组 | 📬 投稿 | 📨 商务

    #AI #语音输入 #效率工具 #Whisper #LazyTyper
  6. 🟠 RealDubbing - 在线文本转语音神器

    🟢 简介:
    一款免费的文本转语音工具,能生成自然流畅的音频,让内容创作变得轻松搞定。

    核心功能:
    海量声音选择: 提供上百种 AI 声音供你选择。
    高度自定义: 可以自定义生成的语音的语速和音高。
    AI 对话生成: 还支持 AI 对话生成功能。
    完全免费: 无需注册,即可无限次生成高品质语音。
    全球语言覆盖: 支持全球多种语言。

    🌐 网站地址:
    点击此处,立即访问

    频道 | 💬 群组 | 📬 投稿 | 📨 商务

    #语音转换 #网站 #TTS #AI工具
  7. #语音转文字 #软件
    语音视频转字幕srt、txt软件
    使用必剪API,语音转字幕。
    支持输入视频文件自动提取音频(ffmpeg)
    支持拖动添加文件
    支持多视频/语音文件的一次性转录
    运行需要安装.NET 6 Runtime和ffmpeg
    下载:https://github.com/Forgot-Dream/STS-Bcut/releases
    蓝奏云:https://noise.lanzoul.com/irLuU0rwx36h
    📡发布:https://noisevip.cn/16116.html
    📢关注频道:@quanshoulu
    💬留言讨论:@Efficiencyfollow
    📬投稿bot:@noisewowbot
    📇搜索bot:@Efficiencysearchbot
    🎁访问主页: www.noisework.cn
  8. #PHP #源码 #语音合成
    微软文本转语音网页版源码
    微软语音合成网页版源码,调用的是官方api
    1.将压缩包内的index.html等文件放到你的站点里,
    2.修改getSpeek.php文件中apikey(密钥)与region(地区)为你自己的,在微软语音合成官网获取。
    3.之后访问index.html文件就可以正常运行了。
    https://noise.lanzoul.com/icuwb0n5xnyj
    📡发布:https://noisevip.cn/15735.html
    📢关注频道:@quanshoulu
    💬留言讨论:@Efficiencyfollow
    📬投稿bot:@noisewowbot
    📇搜索bot:@Efficiencysearchbot
    🎁访问主页: www.noisework.cn