Search: #语音合成
-
- #VoxCPM2 #语音合成 #AI
VoxCPM整合包
VoxCPM 是一个支持中英文、零样本语音克隆、情感可控、音素/公式输入的统一端到端语音合成大模型。它不依赖传统 TTS 流水线(如文本分析 → 音素对齐 → 声码器),而是直接从文本生成高质量语音波形 新版本新增特性: 1.UI颠覆性重构,主要体现在:场景从"语音克隆"+"语音设计"分为"简单场景"+"复杂场景",复杂场景中均支持可控克隆和极致克隆两种方式,适用于不同诉求。特别注意的是Excel中模板根据不同场景拆分为两个,且字段含义不同。 2.新增了api调用及详细说明文档。 3.音色设计页面UI美化,并引入了文本替换 链接:https://pan.quark.cn/s/5ef0eeb56fba
📢关注频道:@quanshoulu
🎁访问主页: www.noisework.cn -
- 🔁 Voicebox
📦 AI语音工具 | 本地语音转文字 | 开源项目➤ 语音转文字|支持本地离线 ASR 识别
➤ 多模型支持|兼容 Whisper / Faster-Whisper
➤ 音频转录|支持 MP3 / WAV / M4A 等格式
➤ 字幕生成|自动生成 SRT 字幕文件
➤ 本地运行|注重隐私 无需上传云端
➤ 开源免费|跨平台桌面应用
🌐 项目地址:
https://github.com/jamiepine/voicebox
📌 简单说:
👉 一个开源的本地 AI 转录工具,可快速把音频视频转换成字幕与文本。
———— 商务合作————
📂 #AI工具 #语音转文字 #Whisper #开源项目
📁 Windows / AI工具 -
-
-
-
-
- 💥 GitHub 爆火开源项目|90 分钟超长语音一口气合成
推荐:开源即登顶的 AI 语音合成项目,程序员圈讨论度极高。
🟢 项目核心亮点:
✅ 超长语音合成: 🗣 一次性合成最长约 90 分钟音频
✅ AI 语音自然: 🎧 语调流畅,适合播客 / 有声书 / 长文本
✅ 开源即爆火: ⭐️ GitHub 上线后迅速登顶热门
✅ 程序员友好: 💻 适合二次开发与自动化集成
✅ 多场景适用: 📚 有声内容制作、旁白、配音等
✅ 长文本语音合成场景下,非常有潜力的开源方案。
🌐 项目链接:
→ ❤️ 点击直达
频道 | 💬 群组 | 📬 投稿 | 📨 商务
#AI #语音合成 #程序员 #GitHub #Soul - #语音合成
基于GPT-SoVITS的视频剪辑快捷配音工具
该项目是一个拥有 GUI 悬浮窗界面的 GPT-SoVITS 推理程序,可以通过模拟操作系统的文件拖拽信号,将合成的语音直接拖拽至视频剪辑软件(如 Adobe Premiere)的时间轴,更加方便地实现视频的配音。
项目地址:https://github.com/2DIPW/dub_genius
推理核心源码基于 RVC-Boss/GPT-SoVITS 修改,GUI 界面基于 PySide6 实现,exe可执行文件由 PyStand 编译。
📥 部署
可以直接下载带有 exe 可执行文件的整合包,也可以自行部署依赖环境并从命令行运行。
整合包
整合包自带全部依赖和预训练模型,以及一个 Python 3.9.13 的嵌入式版本,可通过 exe 可执行文件独立运行。
PyTorch版本 | 大小 | 下载地址
------------------------------
CPU推理版本 | 2.2.1 | 989 MB | OneDrive(https://1drv.ms/u/s!ApF_M_PJgMjabK4tbMUTw5nFt-g?e=C3O0JN) | 百度网盘(https://pan.baidu.com/s/1sKlushysdxq1ce-IBHcJaw?pwd=nqwm)
------------------------------
GPU推理版本 | 2.2.1+cu118 | 2.18 GB | OneDrive(https://1drv.ms/u/s!ApF_M_PJgMjabWCA4_s3fwxwi7M?e=nObvOo)…
📡发布:https://noisevip.cn/17918.html
📢关注频道:@quanshoulu
💬频道社群:https://www.noisework.cn/qun/
📬投稿bot:@noisewowbot
📇搜索bot:@Efficiencysearchbot
🎁访问主页: www.noisework.cn - #语音合成
SummerTTS 是一个基于C++的独立编译的中文语音合成项目,可以本地运行不需要网络,而且没有额外的依赖,一键编译完成即可用于中文语音合成
https://github.com/huakunyang/SummerTTS - #PHP #源码 #语音合成
微软文本转语音网页版源码
微软语音合成网页版源码,调用的是官方api
1.将压缩包内的index.html等文件放到你的站点里,
2.修改getSpeek.php文件中apikey(密钥)与region(地区)为你自己的,在微软语音合成官网获取。
3.之后访问index.html文件就可以正常运行了。
https://noise.lanzoul.com/icuwb0n5xnyj
📡发布:https://noisevip.cn/15735.html
📢关注频道:@quanshoulu
💬留言讨论:@Efficiencyfollow
📬投稿bot:@noisewowbot
📇搜索bot:@Efficiencysearchbot
🎁访问主页: www.noisework.cn -
-
- #开源 #语音合成 #安卓 #win
微软TTS服务转发,以便在阅读APP中通过网络导入方式收听微软TTS / Edge大声朗读
https://github.com/jing332/tts-server-go -
-
- #开源 #语音合成
一个可以录制 Microsoft Edge 浏览器的语音合成(TTS)语音并输出为 .wav 音频的(windows平台)工具。
https://github.com/LuckyHookin/edge-TTS-record -
-