跳转至

OpenTalking

更新日志

datascale-ai/opentalking

更新日志¶

本文档记录 OpenTalking 项目的正式发布、能力进展、主要能力规划和重要兼容性变化。

v0.1.0 - 2026-06-16¶

首个 GitHub Release 发布 OpenTalking 编排层的首个版本包，覆盖 API、Worker、Web 控制台和文档化安装路径。
Docker 交付 增加 opentalking-api、opentalking-worker、opentalking-web 的版本化 GHCR 镜像目标。
Python artifacts Release workflow 会构建并校验 wheel 和 source distribution，并附加到 GitHub Release。
打包边界 Python 包和 Docker 镜像不内置模型权重；模型下载、OmniRT 或本地 runtime 配置以对应文档为准。

2026 年 5 月¶

2026/05/17¶

QuickTalk 接入 QuickTalk / Wav2Lip 新增更便捷使用方式，可通过 OpenTalking 直接拉起推理进行数字人生成。

2026/05/15¶

MuseTalk WebRTC 播放优化 增加 MuseTalk 媒体 backpressure，提升 WebRTC 播放稳定性。

2026/05/14¶

MuseTalk 适配 增加 MuseTalk talking-head 路线，用于轻量全帧数字人验证。

2026/05/13¶

模型 backend 解耦 将 mock、local、direct_ws、omnirt 从架构上拆开，支持不同模型按部署形态选择后端。

2026/05/08¶

QuickTalk 本地适配器 增加 QuickTalk model adapter、配置说明和异步初始化能力。

2026 年 4 月¶

2026/04/16¶

实时数字人基础体验 建立 Web 控制台、LLM 对话、TTS、字幕事件和 WebRTC 音视频播放的主链路。

兼容性说明¶

从 v0.1.0 开始，本文档包含正式 release 版本段落。
模型接入、推理后端和配置项仍在快速迭代；升级前建议同时查看“模型支持”和“使用指南”。
Benchmark 数据需要记录硬件、模型、backend、启动状态和输入素材，不能跨环境直接比较。