更新日志¶
本文档记录 OpenTalking 项目的正式发布、能力进展、主要能力规划和重要兼容性变化。
v0.1.0 - 2026-06-16¶
-
首个 GitHub Release 发布 OpenTalking 编排层的首个版本包,覆盖 API、Worker、Web 控制台和文档化安装路径。
-
Docker 交付 增加
opentalking-api、opentalking-worker、opentalking-web的版本化 GHCR 镜像目标。 -
Python artifacts Release workflow 会构建并校验 wheel 和 source distribution,并附加到 GitHub Release。
-
打包边界 Python 包和 Docker 镜像不内置模型权重;模型下载、OmniRT 或本地 runtime 配置以对应文档为准。
2026 年 5 月¶
2026/05/17¶
- QuickTalk 接入 QuickTalk / Wav2Lip 新增更便捷使用方式,可通过 OpenTalking 直接拉起推理进行数字人生成。
2026/05/15¶
- MuseTalk WebRTC 播放优化 增加 MuseTalk 媒体 backpressure,提升 WebRTC 播放稳定性。
2026/05/14¶
- MuseTalk 适配 增加 MuseTalk talking-head 路线,用于轻量全帧数字人验证。
2026/05/13¶
- 模型 backend 解耦
将
mock、local、direct_ws、omnirt从架构上拆开,支持不同模型按部署形态选择后端。
2026/05/08¶
- QuickTalk 本地适配器 增加 QuickTalk model adapter、配置说明和异步初始化能力。
2026 年 4 月¶
2026/04/16¶
- 实时数字人基础体验 建立 Web 控制台、LLM 对话、TTS、字幕事件和 WebRTC 音视频播放的主链路。
兼容性说明¶
- 从
v0.1.0开始,本文档包含正式 release 版本段落。 - 模型接入、推理后端和配置项仍在快速迭代;升级前建议同时查看“模型支持”和“使用指南”。
- Benchmark 数据需要记录硬件、模型、backend、启动状态和输入素材,不能跨环境直接比较。