源码安装¶

源码安装提供最高的灵活性，是开发场景与昇腾 NPU 部署的必要方式。具体步骤随目标场景而变；本页文档列出各变种的完整流程。

若部署环境与 Docker 支持的配置相符，Docker Compose 安装也是可行选择，运维上可能更为简化。

通用步骤¶

下述步骤为所有源码安装共用。

1. 克隆仓库¶

终端

git clone https://github.com/datascale-ai/opentalking.git
cd opentalking

仓库假定父目录同时包含 OmniRT 的 checkout，用于使用真实 talking-head 模型的部署。推荐目录结构：

$DIGITAL_HUMAN_HOME/
├── opentalking/
├── omnirt/
└── models/
    ├── wav2lip/
    ├── SoulX-FlashTalk-14B/
    └── chinese-wav2vec2-base/

设置环境变量：

终端

export DIGITAL_HUMAN_HOME=/opt/digital_human   # 或自定义路径
export OMNIRT_MODEL_ROOT="$DIGITAL_HUMAN_HOME/models"

2. 安装 Python 依赖¶

终端

uv sync --extra dev --python 3.11
source .venv/bin/activate

[dev] extra 安装运行时依赖与 ruff、pytest、pytest-asyncio、pytest-cov 等开发工具。

如需兼容 fallback，可使用：

终端

python3 -m venv .venv
source .venv/bin/activate
pip install --index-url https://pypi.tuna.tsinghua.edu.cn/simple -e ".[dev]"

说明：

当前锁文件按 Python 3.11 验证。
命中 PyAV wheel 时，只需要运行时 ffmpeg。
如果切到未验证的 Python / PyAV 组合并触发源码构建，则还需要 ffmpeg 7、pkg-config 和 C 编译器。

3. 安装前端依赖¶

终端

cd apps/web
npm ci
cd ../..

4. 配置环境¶

终端

cp .env.example .env

编辑 .env 并配置最小必填变量：

.env

OPENTALKING_LLM_API_KEY=<dashscope-api-key>
DASHSCOPE_API_KEY=<dashscope-api-key>

两个变量须配置为同一把 DashScope API Key。完整配置参考见配置。

5. 验证安装¶

终端

opentalking-unified --help
opentalking-api --help
opentalking-worker --help

场景：开发（CPU + mock 合成）¶

适用于无 GPU 的工作站上进行前端开发、API 迭代与编排修改。

启动单进程服务¶

终端

bash scripts/quickstart/start_mock.sh

该命令启动 OpenTalking 单进程服务（http://127.0.0.1:8000）与 Vite 开发服务器（http://localhost:5173）。mock 合成路径返回占位帧，无须推理服务。

后端开发热重载：

终端

uvicorn apps.unified.main:app --reload --port 8000

前端单独启动：

终端

cd apps/web
npm run dev -- --host 0.0.0.0

资源占用：

单进程内存 1–2 GB。
无 GPU。
需访问已配置的语言模型与 TTS 端点。

场景：单 GPU + Wav2Lip¶

适用于单张 NVIDIA 3090 或同级 24 GB GPU 上使用轻量级 wav2lip 模型评估。

安装 OmniRT¶

OmniRT 为推理运行时，在 OpenTalking 同级目录 clone：

终端

cd "$DIGITAL_HUMAN_HOME"
git clone https://github.com/datascale-ai/omnirt.git
cd omnirt
uv sync --extra server --python 3.11

下载模型权重¶

终端

mkdir -p "$OMNIRT_MODEL_ROOT/wav2lip"
# 将 wav2lip384.pth 与 s3fd.pth 放入 $OMNIRT_MODEL_ROOT/wav2lip/
# 当前下载位置请参阅 OmniRT 文档。

启动 OmniRT¶

终端

bash "$DIGITAL_HUMAN_HOME/opentalking/scripts/quickstart/start_omnirt_wav2lip.sh" --device cuda

脚本完成依赖安装、环境变量配置，并在 http://127.0.0.1:9000 启动 OmniRT。进程 PID 写入 $DIGITAL_HUMAN_HOME/run/omnirt-wav2lip.pid，日志位于 $DIGITAL_HUMAN_HOME/logs/omnirt-wav2lip.log。

配置 OpenTalking¶

在 .env 中追加：

OMNIRT_ENDPOINT=http://127.0.0.1:9000

启动 OpenTalking¶

终端

cd "$DIGITAL_HUMAN_HOME/opentalking"
bash scripts/quickstart/start_all.sh --omnirt http://127.0.0.1:9000

前端创建会话时选择 wav2lip 模型。

资源占用：

1 张 24 GB 显存的 NVIDIA GPU。
16 GB 内存。
5 GB 磁盘空间用于 wav2lip 权重。

场景：单 GPU + FlashTalk¶

适用于单张 NVIDIA 4090 或 A100 上使用 SoulX FlashTalk-14B 模型评估。

步骤与 wav2lip 场景一致，差异如下：

终端：启动 OmniRT

bash "$DIGITAL_HUMAN_HOME/opentalking/scripts/quickstart/start_omnirt_flashtalk.sh" --device cuda

模型权重：

SoulX-FlashTalk-14B/（约 28 GB），位于 $OMNIRT_MODEL_ROOT/。
chinese-wav2vec2-base/（约 400 MB），位于 $OMNIRT_MODEL_ROOT/。

资源占用：

1 张至少 22 GB 可用显存的 NVIDIA GPU（4090 24 GB 或 A100 40 GB）。
32 GB 内存。
35 GB 磁盘空间用于 FlashTalk 与 wav2vec2 权重。

如显存受限，可通过配置 → FlashTalk 渲染参数中的参数调低消耗。

场景：昇腾 910B¶

NPU 生产部署，须 CANN 8.0 或更新版本。

验证 CANN 安装¶

终端

test -f /usr/local/Ascend/ascend-toolkit/set_env.sh && echo "CANN 已就绪"
source /usr/local/Ascend/ascend-toolkit/set_env.sh
npu-smi info

安装 OpenTalking¶

先按通用步骤完成 OpenTalking 安装，推荐使用 Python 3.11。国内网络环境建议先配置：

终端

export UV_INDEX_URL=https://pypi.tuna.tsinghua.edu.cn/simple
export PIP_INDEX_URL=https://pypi.tuna.tsinghua.edu.cn/simple

OmniRT 需要 NPU 专用的 PyTorch wheel，由部署脚本完成。

部署¶

终端

source /usr/local/Ascend/ascend-toolkit/set_env.sh
cd "$DIGITAL_HUMAN_HOME/opentalking"
bash scripts/deploy_ascend_910b.sh

脚本执行：

source CANN 环境文件。
校验同级 omnirt/ checkout、OmniRT virtualenv 和 wav2lip 权重目录。
配置 NPU 专属环境变量（OMNIRT_WAV2LIP_DEVICE=npu、OMNIRT_WAV2LIP_FACE_DET_DEVICE=cpu）。
通过 scripts/quickstart/start_omnirt_wav2lip.sh --device npu 启动 OmniRT。

支持的模型¶

模型	在昇腾 910B 上的状态
`mock`	支持
`wav2lip`	通过 OmniRT `--backend ascend` 支持
`flashtalk`	支持
`musetalk`	当前未移植

资源占用：

1 张昇腾 910B 卡（Atlas 800T 或同级服务器）。
CANN 8.0 或更新版本。
torch-npu 包，由部署脚本安装。

场景：API 与 Worker 分离¶

适用于需要 Worker 横向扩展或组件隔离的生产部署。架构与运行特性详见部署 → API 与 Worker 分离。

前置条件¶

在通用安装之外，另需：

Redis 6 或更新版本，API 与 Worker 进程均能访问。
进程管理器（systemd、supervisor、Kubernetes Deployment）。

配置¶

相关环境变量（详见配置 §3）：

.env

OPENTALKING_REDIS_URL=redis://<redis-host>:6379/0
OPENTALKING_API_HOST=0.0.0.0
OPENTALKING_API_PORT=8000
OPENTALKING_WORKER_HOST=0.0.0.0
OPENTALKING_WORKER_PORT=9001
OPENTALKING_WORKER_URL=http://<worker-host>:9001

启动¶

API 与 Worker 进程分别启动：

终端：API

uvicorn apps.api.main:app --host 0.0.0.0 --port 8000

终端：Worker

python -m apps.worker.main --host 0.0.0.0 --port 9001

可在多台主机上启动多个 Worker 进程；每个 Worker 订阅同一 Redis 总线。

场景：生产部署¶

源码安装下的单机生产部署：

按目标硬件场景完成 OpenTalking 与 OmniRT 安装。
按配置 → 生产部署配置 .env。
将相关命令封装到进程管理器中。systemd unit 示例：

/etc/systemd/system/opentalking.service

[Unit]
Description=OpenTalking unified server
After=network.target redis.service
Requires=redis.service

[Service]
Type=simple
User=opentalking
WorkingDirectory=/opt/digital_human/opentalking
EnvironmentFile=/opt/digital_human/opentalking/.env
ExecStart=/opt/digital_human/opentalking/.venv/bin/opentalking-unified
Restart=on-failure
RestartSec=5

[Install]
WantedBy=multi-user.target

按部署 → 生产部署清单完成上线前的配置项。

更新¶

更新已有源码安装：

终端

cd "$DIGITAL_HUMAN_HOME/opentalking"
git pull
uv sync --extra dev --python 3.11
source .venv/bin/activate
cd apps/web && npm ci && cd ../..

数据库 schema 迁移在进程启动时自动执行。

故障排查¶

现象	处理方式
`ModuleNotFoundError: opentalking`	通过 `source .venv/bin/activate` 激活虚拟环境，或执行 `uv sync --extra dev --python 3.11`；兼容 fallback 为 `pip install --index-url https://pypi.tuna.tsinghua.edu.cn/simple -e ".[dev]"`。
TTS 解码时报 `ffmpeg: not found`	安装 ffmpeg。macOS：`brew install ffmpeg`；Debian/Ubuntu：`apt install ffmpeg`。
`torch.cuda.is_available()` 返回 False	检查 NVIDIA driver、CUDA Toolkit，以及 `torch` 包是否与 CUDA 版本匹配。
OmniRT 因 `CUDA out of memory` 退出	降低 `OPENTALKING_FLASHTALK_FRAME_NUM`、`OPENTALKING_FLASHTALK_SAMPLE_STEPS` 或输出分辨率，参见配置 → FlashTalk 渲染参数。
`npu-smi: command not found`	CANN toolkit 未加入 PATH，执行 `source /usr/local/Ascend/ascend-toolkit/set_env.sh`。
端口 8000 被占用	通过启动脚本的 `--api-port` 或 `.env` 中的 `OPENTALKING_API_PORT` 覆盖。

卸载¶

移除源码安装：

终端

cd "$DIGITAL_HUMAN_HOME"
rm -rf opentalking omnirt models
# 可选：移除日志与 PID 目录
rm -rf "$DIGITAL_HUMAN_HOME/logs" "$DIGITAL_HUMAN_HOME/run"

OPENTALKING_SQLITE_PATH 指向的本地 SQLite 数据库若位于仓库内，也将一并移除。