Skip to main content
全网优质资源汇总✨

Search: #AI直播

  1. 🔁 Gemini 3.1 Flash TTS
    📦 AI语音合成 | Google TTS | 文本转语音


    ➤ Google新模型|Gemini 3.1 Flash TTS
    ➤ AI语音生成|文本快速转换自然语音
    ➤ 多语言支持|适合配音与内容创作
    ➤ 低延迟输出|面向实时语音场景
    ➤ AI Studio体验|浏览器直接测试
    ➤ 免费试用|无需本地部署


    🌐 在线体验:
    https://aistudio.google.com/generate-speech?model=gemini-3.1-flash-tts-preview

    📌 简单说:
    👉 Google 在 AI Studio 中推出的 Gemini 3.1 Flash TTS 语音模型,可将文本快速转换为自然语音,适用于配音、数字人、播客和语音助手等场景。

    📂 #Gemini #TTS #AI语音 #GoogleAI
    📁 在线工具
  2. AIGCPanel

    一款简单易用的一站式AI数字人系统,即使是小白用户也能轻松上手。它集成了视频合成、语音合成、语音克隆等核心功能,大大简化了本地AI模型的管理流程,支持一键导入和使用各种AI模型,让AI创作变得触手可及。
    视频数字人合成:支持视频画面与声音的精准换口型匹配,打造逼真数字人效果
    语音处理:提供语音合成、语音克隆、视频声音替换功能,支持多种声音参数自定义设置
    模型管理:支持多模型导入、一键启动、模型配置、日志查看等便捷操作
    国际化支持:内置简体中文和英语界面,满足不同用户需求
    一键启动包:提供多种模型的一键启动包,快速部署和使用


    点击访问

    #开源 #AI数字人 #电脑软件 #AI直播
  3. 🎧 GitHub 开源神器|小爱音箱听歌自由了!
    告别平台限制 · 想听什么就听什么

    💥 程序员黑科技|小米用户必看

    🟢 这个项目能干嘛?


    🎵 听歌自由: 突破小爱音箱原有音乐平台限制
    🤖 智能音箱适配: 专为小爱音箱等设备打造
    🔓 完全开源: GitHub 免费开源,可自行部署
    ⚙️ 高度可玩: 适合动手能力强的程序员 / 折腾党
    🧠 AI + 自动化: 结合智能控制,实现更自由的播放体验



    🚀 一句话:
    这是一个让小爱音箱真正“为你服务”的开源黑科技项目。

    📖 网站入口: 
    👉点击直达

    📢 频道 | 💬 群组 | 📬 投稿 | 📨 商务

    #GitHub #开源项目 #小爱音箱 #黑科技 #程序员 #AI
  4. 💥 GitHub 爆火开源项目|90 分钟超长语音一口气合成
    推荐:开源即登顶的 AI 语音合成项目,程序员圈讨论度极高。

    🟢 项目核心亮点:


    超长语音合成: 🗣 一次性合成最长约 90 分钟音频
    AI 语音自然: 🎧 语调流畅,适合播客 / 有声书 / 长文本
    开源即爆火: ⭐️ GitHub 上线后迅速登顶热门
    程序员友好: 💻 适合二次开发与自动化集成
    多场景适用: 📚 有声内容制作、旁白、配音等


    长文本语音合成场景下,非常有潜力的开源方案。

    🌐 项目链接:
    ❤️ 点击直达

    频道 | 💬 群组 | 📬 投稿 | 📨 商务

    #AI #语音合成 #程序员 #GitHub #Soul
  5. Super Agent Party |一款拥有无限可能的3D版AI桌宠!

    无处不在的AI桌面女友!可接入QQ、飞书、telegram、discord、b站、YouTube、twitch、Dify、 Home Assistant、MCP、A2A、Comfyui、酒馆角色卡、Cluade code等生态!
    无缝能力增强:无需代码改造即可实现LLM API企业级升级,为现有模型接口无缝集成知识库、实时联网、永久记忆、代码执行、多模态能力(视觉/绘图/听觉/语音)、自动化能力(控制智能家居、控制浏览器)、深度思考控制与研究等模块化功能,打造可插拔的LLM增强中台。
    全渠道一键部署:支持将智能体配置快速部署至多类终端,已兼容经典聊天界面、QQ官方机器人、B站直播互动、VRM虚拟桌宠等场景,开箱即用。
    生态工具互联:可自由接入第三方智能体与工作流作为工具链(已适配ComfyUI/MCP/A2A等系统),通过agent-party架构实现跨平台能力聚合。
    标准化接口开放:提供OpenAI API兼容接口及MCP协议支持,便于开发者直接对接外部系统,实现智能体能力的快速转接与二次开发。
    全平台兼容适配:覆盖Windows/macOS/Linux原生运行环境,支持Docker容器化部署与Web端云服务,满足多场景技术栈需求。


    点击访问

    #电脑软件 #开源 #AI桌面伴侣
  6. FlyCut Caption - 智能视频字幕裁剪工具

    一个强大的 AI 驱动的视频字幕编辑工具,专注于智能字幕生成、编辑和视频裁剪
    智能语音识别:基于 Whisper 模型的高精度语音转文字,支持多种语言
    可视化字幕编辑:直观的字幕片段选择和删除界面
    实时视频预览:与字幕同步的视频播放器,支持区间播放
    多格式导出:支持 SRT、JSON 字幕格式以及视频文件导出
    字幕样式定制:自定义字幕字体、颜色、位置等样式
    国际化支持:组件化国际化设计,支持中文、英文、自定义语言包(如日语示例)


    项目地址 在线试用

    Ken有话说:对做自媒体的帮孩子很多,从YouTube搬运视频用这个转中文字幕简直无敌


    #开源 #AI字幕 #字幕生成
  7. Luna AI
    一款结合了最先进技术的虚拟AI主播。它的核心是一系列高效的人工智能模型和平台,包括 ChatterBot、GPT、Claude、langchain、chatglm、text-generation-webui、讯飞星火、智谱AI、谷歌Bard、文心一言、通义星尘、通义千问、千帆大模型、Gemini、Kimi Chat、QAnything、koboldcpp、FastGPT、Ollama、One-API、AnythingLLM。这些模型既可以在本地运行,也可以通过云端服务提供支持。当然,为了让对话照进现实,还结合了多模态模型,包括 Gemini、glm-4v 的图像识别能力,获取电脑画面进行分析讲解。
    Luna AI 的外观由 Live2D、Vtube Studio、xuniren、UE5 结合 Audio2Face、EasyAIVtuber、数字人视频播放器(Easy-Wav2Lip、Sadtalker、GeneFace++、MuseTalk、本地视频)、metahuman-stream(ernerf、musetalk) 技术打造,为用户提供了一个生动、互动的虚拟形象。这使得 Luna AI 能够在各大直播平台,如 Bilibili、抖音、快手、微信视频号、拼多多、1688、斗鱼、YouTube、Twitch 和 TikTok,进行实时互动直播。当然,它也可以在本地环境中与您进行个性化对话。
    为了使交流更加自然,Luna AI 使用了先进的自然语言处理技术,结合文本转语音系统,如 Edge-TTS、VITS-Fast、elevenlabs、bark-gui、VALL-E-X、睿声AI、genshinvoice.top、tts.ai-lab.top、OpenVoice、GPT_SoVITS、clone-voice、Azure TTS、fish-speech、ChatTTS。这不仅让它能够生成流畅的回答,还可以通过 so-vits-svc 和 DDSP-SVC 实现声音的变化,以适应不同的场景和角色。
    此外,Luna AI 还能够通过特定指令与 Stable Diffusion 协作,展示画作。用户还可以自定义文案,让 Luna AI 循环播放,以满足不同场合的需求。

    本项目完全免费,如有发现一模一样的套壳售卖程序,皆为盗版,请及时止损

    项目地址
    #开源 #Ai
  8. #AI #播客
    Podwise-超强播客AI工具
    ![](https://jsd.onmicrosoft.cn/gh/rcy1314/tuchuang@main/20231008/1696761629640.3g7d5tijbmy0.jpg)

    介绍

    Podwise 是一个江ai和播客相结合的工具,有趣的是它提供 Podwise 与 Nottion、Obsidian、Readwise 等工具无缝集成,简化您的知识管理工作流程

    官网

    https://podwise.xyz/i/191

    特征

    订阅任何内容

    轻松订阅您喜欢的任何内容,并在发布新的播客剧集时以闪电般的速度获得完整的结构化知识。

    总结

    借助 AI 驱动的摘要,您可以在一分钟内掌握任何剧集的主要精髓。

    思维导图

    剧集的内容以思维导图的形式惊人地呈现,帮助您更轻松地理解内容。

    大纲

    剧集内容浓缩成 3 分钟的大纲,提取关键点并提供当前持续时间的摘要。



    如果您对概述的要点特别感兴趣,可以直接点击收听相应的内容。

    值得引用

    我们从剧集中提取值得注意的引文,让您对每一集都有更好的感觉。

    抄写

    准确转录的文本可帮助您搜索关键信息并重播感兴趣的部分。

    连接

    与您的知识管理工作流程无缝连接,包括概念、黑曜石、阅读等,从而实现高效的知识管理。

    当然,你依然可以通过RSS来订阅你喜欢的频道

    使用

    你可以免费获得

    - 4集/月为已读处理集
    - 每周时事通讯
    📡发布:https://noisevip.cn/17223.html
    📢关注频道:@quanshoulu
    💬频道社群:https://www.noisework.cn/qun/
    📬投稿bot:@noisewowbot
    📇搜索bot:@Efficiencysearchbot
    🎁访问主页: www.noisework.cn
  9. #AI #AI视频
    Genmo-AI从文本创建图像、视频及3D资产
    介绍
    Genmo是一个创建和分享互动式、沉浸式生成艺术的平台。通过创建视频、动画等来超越Genmo上的2D图像
    官网
    地址:https://www.genmo.ai/
    新变化
    Replay,这是一种新的 AI 模型,可以从文本中生成令人惊叹的视频。 重播v0.1旨在创建具有新界面的超流畅高清视频。今天可供所有人使用。 有什么新变化? 1.重播理解简单的英语提示,无需提示工程。尝试“粗犷的冲浪者”或“美人鱼”。 2.没有演员的电影是什么?重播可以清晰地渲染人和动物的特写镜头。 3.从我们的主页免费快速生成,无需等待名单(生物链接)。 在幕后,Replay通过将新的视频传播模型与Genmo Chat背后的LLM对齐而提供支持。
    Replay 只需几句话来描述一个想法,它就会合成令人惊叹的高质量视频剪辑,使视觉场景栩栩如生。
    在引擎盖下,Genmo Replay代表了多模态生成AI的飞跃。Replay的核心是扩展了为Genmo Chat提供支持的多模式LLM技术。这使得 Replay 能够理解日常语言,而无需高级提示工程,同时还确保了生成输出的安全性。而我们才刚刚开始。
    功能一览
    - 高清视频输出:不再有像素化视频,只有高分辨率输出。期待高清剪辑:至少 720p 以 30 FPS 的速度。
    - 逼真的质量:Replay的视频流畅而优雅,确保视觉上令人愉悦的体验。标识在具有连贯运动的剪辑中是一致的。该模型特别擅长人和动物的特写镜头,但您可以尽情发挥想象力。
    - 选择宽高比: 重播支持从横向 (16:9) 到纵向 (9:16) 的纵横比。准备好将您的肖像作品直接分享到 TikTok 或其他移动优先的社交平台。
    - 简单提示:重播理解日常语言,如果用户选择,则无需复杂的提示。
    -…
    📡发布:https://noisevip.cn/17102.html
    📢关注频道:@quanshoulu
    💬频道社群:https://www.noisework.cn/qun/
    📬投稿bot:@noisewowbot
    📇搜索bot:@Efficiencysearchbot
    🎁访问主页: www.noisework.cn
  10. #AI
    智能AI视频创作神器:一帧秒创
    前言:关于一帧秒创我以前介绍过,只不过当时的模式只有AI视频方向,现在它得到了进一步成长,可以再来了解下

    介绍

    一帧秒创是基于秒创AIGC引擎的智能AI内容创作平台,为200万+创作者提供包括文字续写、文字转语音、文生图、图文转视频、AI成片、数字人播报等创作服务,产品包括秒创数字人、秒创AI帮写、秒创图文转视频、秒创AI视频、秒创AI语音、秒创AI作画等。

    官网链接:https://aigc.yizhentv.com/?_f=nobaibao

    功能

    1、 秒创数字人

    智能数字人播报平台,输入文案,一键生成“真人”营销视频。AI数字人是以数字孪生等AI技术为基础,1:1还原真人形象、动作、神态、声音,无限逼近真人的数字分身。甚至还可以1:1还原真人形象+1:1还原真人音色,定制专属于您的数字人形象和声音,帮助您快速完成企业和个人IP打造,助力营销增长。

    2、 秒创图文转视频

    作为国内领先的智能内容创作平台,输入文案,智能匹配,AI将根据语意自动匹配画面,快速实现从文案到视频的制作,实现全自动文章转视频、图文转视频。画面匹配、智能配音、智能字幕等功能,AI都能完美实现。高效产出内容的同时,支持非常灵活的细节调整,文稿、音乐、配音、粗剪、LOGO、字幕、语速等功能,一应俱全。海量在线素材,可任意替换选择,一键图文成片。

    3、 秒创AI帮写

    智能文案写作平台,输入灵感,文思泉涌,出“手”成章。一帧秒创提供短视频、营销、直播、风格文案4大类型AI帮写模板,全方位满足用户需求,甚至能直接输出直播脚本,大大提升运营和主播同学的效率。短视频内容、营销文案,秒创AI帮写统统都能帮你搞定。

    4、 秒创AI作画…
    📡发布:https://noisevip.cn/17103.html
    📢关注频道:@quanshoulu
    💬频道社群:https://www.noisework.cn/qun/
    📬投稿bot:@noisewowbot
    📇搜索bot:@Efficiencysearchbot
    🎁访问主页: www.noisework.cn
  11. #AI #开源 #直播 #虚拟主播
    GPT-vup BIliBili | 抖音 | AI | 虚拟主播
    一个开源新项目用于BiliBili和抖音直播,基于生产者-消费者模型设计
    使用了openai嵌入、GPT3.5 api,
    项目访问地址:https://github.com/jiran214/GPT-vup
    功能
    - 基本功能,回答弹幕和SC、欢迎入场观众、感谢礼物
    ◦ speech:监听ctrl+t热键,输入语音转为文本和ai数字人交互
    ◦ action:根据观众的行为匹配对应人物动作
    ◦ schedule:隔一段时间触发某一事件,讲故事、唱rap…
    ◦ context:给问题补充上下文
    B站直播
    - 安装依赖库:>>pip install bilibili-api-python
    - config.ini 的 room -> id 更改为自己的房间号,可以先随便找个
    - src目录下运行:>>python manager.py run bilibili
    抖音直播
    - 参考 抖音弹幕抓取数据推送: 基于系统代理抓包打造的抖音弹幕服务推送程序
    - 启动该项目
    - 打开web或者桌面端抖音正在直播的直播间,数据开始抓取
    - src目录下运行:>>python manager.py run douyin
    Vtube Studio 安装及配置
    - 在steam下载Vtube Studio软件
    - 教程:https://www.bilibili.com/video/BV1nV4y1X7yJ?t=426.7
    -…
    📡发布:https://noisevip.cn/16756.html
    📢关注频道:@quanshoulu
    💬留言讨论:@Efficiencyfollow
    📬投稿bot:@noisewowbot
    📇搜索bot:@Efficiencysearchbot
    🎁访问主页: www.noisework.cn