Skip to main content
全网优质资源汇总✨

Search: #数字人

  1. 🔁 OpenTalking
    📦 开源数字人 | 实时语音对话 | WebRTC框架


    ➤ 实时数字人|支持语音、字幕与视频实时互动
    ➤ 多模型接入|兼容 LLM、TTS、STT 等模型服务
    ➤ WebRTC支持|低延迟音视频实时传输
    ➤ 数字人驱动|支持 Wav2Lip、MuseTalk 等方案
    ➤ 可插拔架构|支持本地或远程模型部署
    ➤ 开源免费|基于 FastAPI + React 构建


    🌐 GitHub:
    https://github.com/datascale-ai/opentalking

    📌 简单说:
    👉 一个开源实时数字人对话框架,集成大模型、语音识别、语音合成、字幕和 WebRTC 音视频能力,可快速搭建 AI 数字人、虚拟主播和智能客服等应用。

    📂 #数字人 #AI语音 #WebRTC #大模型
    📁 Windows / Linux / AI工具
  2. CyberVerse

    一个开源的 实时音视频 AI Agent 平台,基于 WebRTC、角色记忆、工具调用、RAG(检索增强生成)以及可选的数字人视频能力,帮助开发者快速构建以语音交互为核心的智能体。它支持语音与文本混合输入、实时打断与恢复、角色个性化配置,并可扩展为带有数字人视频的交互体验。

    项目地址

    使用有技术门槛,可把项目丢给AI教您怎么做


    #CyberVerse #开源 #AIAgent #实时语音 #数字人
  3. #数字人 #Agent

    CyberVerse - 一个开源的数字人智能体平台

    仅需一张照片,CyberVerse 就能快速生成一个会看、会听、能实时视频通话的 AI 数字人,体验接近真实视频通话。

    核心特点

    一张照片即刻复活:上传照片就能生成具备实时面部动画、自然口型同步和呼吸感的数字人。
    低延迟实时视频通话:基于 WebRTC + P2P 传输 + TURN 穿透,实现首帧约 1.5 秒的超低延迟,支持无限时长视频交互。
    模块化 Agent 架构:大脑(LLM)、面孔(Avatar)、声音(TTS)、听觉(ASR)全部可插拔,通过 YAML 配置自由组合,支持不同模型混搭。
    AI 能力:实时语音交互、声音克隆、视觉理解(动作/手势)、RAG 知识问答、语音打断等,支持豆包语音等模型。
    本地部署友好:支持 PyTorch CUDA 加速,多档位模型适配不同 GPU。


    📮投稿 📢频道 💬吹水 🌐网站
  4. YouTube 评论查找器

    一款功能强大的工具,帮助用户快速搜索和分析 YouTube 视频评论。提供快速搜索功能,通过关键字、日期和用户活动等高级过滤器,简化评论筛选流程,节省内容分析时间。其直观的用户友好设计确保轻松访问有价值的反馈和讨论,适合内容创作者和研究人员使用。该工具支持输入视频链接、设置搜索条件并下载评论,助力用户高效收集见解、提升数据分析准确性,并优化内容创作效率,是研究观众反馈和制定内容策略的理想选择。

    点击访问

    #YouTube评论 #数据分析 #内容创作 #工具总结
  5. 小云雀

    剪映出品的一款全能型AI创作助手,致力于将专业的视频与图片创作过程简化为一句指令。无论是需要根据主题一键生成融合实拍与AI素材的短视频,还是用丰富的数字人形象生成口播内容,亦或是进行批量AI设计和专业级图片背景替换,小云雀都能高效完成,助您的内容脱颖而出。
    其特色在于强大的自动化能力与极致的简化操作。AI能智能分析需求,自动完成脚本构思、分镜设计乃至调色配乐等繁琐工作,彻底解放用户的创造力。简洁的界面与零学习成本的设计,让每一位用户都能轻松驾驭AI,告别创意忧愁。

    访问官网

    #小云雀 #剪映 #AI创作 #AIGC #数字人 #智能成片 #视频剪辑 #创作工具