跳转至

QuickTalk Local 部署

Local 模式把 QuickTalk adapter 加载在 OpenTalking 进程内,适合单机 CUDA 机器验证实时口播、调试 avatar cache,以及在引入 OmniRT 前确认前后端链路。

适用场景

  • 已经跑通 mock,现在需要真实 talking-head 输出。
  • 单机部署,GPU、WebUI、API 都在同一台机器。
  • 需要使用 opentalking-prepare-cache 为常用通用 avatar 预热 QuickTalk 缓存。

权重准备

权重统一放在仓库根目录 models/quicktalk/。网络慢时可以设置 HF_ENDPOINT

终端
cd "$DIGITAL_HUMAN_HOME/opentalking"
mkdir -p models/quicktalk/checkpoints

uv pip install -U "huggingface_hub[cli]"
export HF_ENDPOINT="${HF_ENDPOINT:-https://hf-mirror.com}"

hf download datascale-ai/quicktalk \
  quicktalk.pth \
  repair.npy \
  chinese-hubert-large/config.json \
  chinese-hubert-large/preprocessor_config.json \
  chinese-hubert-large/pytorch_model.bin \
  --local-dir models/quicktalk/checkpoints

InsightFace buffalo_l 需要单独准备:

终端
mkdir -p /tmp/opentalking-insightface models/quicktalk/checkpoints/auxiliary/models
curl -L \
  -o /tmp/opentalking-insightface/buffalo_l.zip \
  https://github.com/deepinsight/insightface/releases/download/v0.7/buffalo_l.zip
unzip -q -o /tmp/opentalking-insightface/buffalo_l.zip \
  -d /tmp/opentalking-insightface
rsync -a /tmp/opentalking-insightface/buffalo_l/ \
  models/quicktalk/checkpoints/auxiliary/models/buffalo_l/

启动命令

终端
cd "$DIGITAL_HUMAN_HOME/opentalking"
uv sync --extra dev --extra models --extra quicktalk-cuda --python 3.11

export OPENTALKING_TORCH_DEVICE=cuda:0
export OPENTALKING_QUICKTALK_ASSET_ROOT="$DIGITAL_HUMAN_HOME/opentalking/models/quicktalk"
export OPENTALKING_QUICKTALK_WORKER_CACHE=1

bash scripts/start_unified.sh --backend local --model quicktalk --api-port 8210 --web-port 5280

打开 http://localhost:5280,选择通用 avatar 和 quicktalk 模型。如果需要固定模板视频, 请在会话或部署配置中确认模板资源可访问。

验证命令

终端
curl -fsS http://127.0.0.1:8210/health
curl -s http://127.0.0.1:8210/models | jq '.statuses[] | select(.id=="quicktalk")'

期望返回 backend=localconnected=true。如需提前生成缓存:

终端
opentalking-prepare-cache \
  --model quicktalk \
  --avatars-root examples/avatars \
  --quicktalk-model-root models/quicktalk \
  --device cuda:0 \
  --model-backend pth \
  --verify

常见错误

现象 处理
connected=false 检查 OPENTALKING_QUICKTALK_ASSET_ROOT、CUDA 设备和 models/quicktalk/checkpoints
首轮等待很久 开启 OPENTALKING_QUICKTALK_WORKER_CACHE=1 或提前执行 opentalking-prepare-cache
avatar 加载失败 检查 avatar 是否能被服务读取;如配置了固定模板视频,确认路径可访问。
Hugging Face 下载失败 配置 HF_ENDPOINT 或先离线下载后同步到同样目录。