跳转至

OpenTalking

教程

datascale-ai/opentalking

教程¶

教程按任务路径组织，适合从零开始跑通 OpenTalking，或在已有环境上接入真实模型、Avatar 和开发调试流程。

首次运行¶

安装 —— 确认 Python、Node.js、ffmpeg、DashScope key 和硬件要求。
快速上手 —— 用 mock 合成路径跑通浏览器、API、LLM、STT、TTS 和 WebRTC。
配置 —— 理解 .env、YAML 配置、provider 和 backend 优先级。
Mock 端到端案例 —— 用最小链路验证本机环境。

接入真实模型¶

先用 mock 确认编排链路健康，再接入真实 talking-head backend：

场景	推荐教程
第一个真实唇形模型	Wav2Lip 接入
高质量 FlashTalk/OmniRT 路径	FlashTalk 接入
选择模型、权重和部署拓扑	模型部署

这些页面偏底层接入步骤；如果想先看“能用在哪些业务场景”，请看场景案例。

自定义 Avatar¶

从自定义 Avatar 案例开始，了解图片、视频和 manifest.json 如何组合成可被 OpenTalking 发现的 avatar bundle。字段细节见 Avatar 格式。

开发调试¶

目标	入口
修改 API、会话或 Worker 行为	开发流程
理解系统组件和数据流	架构设计
接入新的 talking-head backend	模型适配器
排查性能与首帧延迟	Benchmark