QuickTalk Local 部署¶
Local 模式把 QuickTalk adapter 加载在 OpenTalking 进程内,适合单机 CUDA 机器验证实时口播、调试 avatar cache,以及在引入 OmniRT 前确认前后端链路。
适用场景¶
- 已经跑通
mock,现在需要真实 talking-head 输出。 - 单机部署,GPU、WebUI、API 都在同一台机器。
- 需要使用
opentalking-prepare-cache为常用通用 avatar 预热 QuickTalk 缓存。
权重准备¶
权重统一放在仓库根目录 models/quicktalk/。网络慢时可以设置 HF_ENDPOINT。
终端
cd "$DIGITAL_HUMAN_HOME/opentalking"
mkdir -p models/quicktalk/checkpoints
uv pip install -U "huggingface_hub[cli]"
export HF_ENDPOINT="${HF_ENDPOINT:-https://hf-mirror.com}"
hf download datascale-ai/quicktalk \
quicktalk.pth \
repair.npy \
chinese-hubert-large/config.json \
chinese-hubert-large/preprocessor_config.json \
chinese-hubert-large/pytorch_model.bin \
--local-dir models/quicktalk/checkpoints
InsightFace buffalo_l 需要单独准备:
终端
mkdir -p /tmp/opentalking-insightface models/quicktalk/checkpoints/auxiliary/models
curl -L \
-o /tmp/opentalking-insightface/buffalo_l.zip \
https://github.com/deepinsight/insightface/releases/download/v0.7/buffalo_l.zip
unzip -q -o /tmp/opentalking-insightface/buffalo_l.zip \
-d /tmp/opentalking-insightface
rsync -a /tmp/opentalking-insightface/buffalo_l/ \
models/quicktalk/checkpoints/auxiliary/models/buffalo_l/
启动命令¶
终端
cd "$DIGITAL_HUMAN_HOME/opentalking"
uv sync --extra dev --extra models --extra quicktalk-cuda --python 3.11
export OPENTALKING_TORCH_DEVICE=cuda:0
export OPENTALKING_QUICKTALK_ASSET_ROOT="$DIGITAL_HUMAN_HOME/opentalking/models/quicktalk"
export OPENTALKING_QUICKTALK_WORKER_CACHE=1
bash scripts/start_unified.sh --backend local --model quicktalk --api-port 8210 --web-port 5280
打开 http://localhost:5280,选择通用 avatar 和 quicktalk 模型。如果需要固定模板视频,
请在会话或部署配置中确认模板资源可访问。
验证命令¶
终端
curl -fsS http://127.0.0.1:8210/health
curl -s http://127.0.0.1:8210/models | jq '.statuses[] | select(.id=="quicktalk")'
期望返回 backend=local、connected=true。如需提前生成缓存:
终端
opentalking-prepare-cache \
--model quicktalk \
--avatars-root examples/avatars \
--quicktalk-model-root models/quicktalk \
--device cuda:0 \
--model-backend pth \
--verify
常见错误¶
| 现象 | 处理 |
|---|---|
connected=false |
检查 OPENTALKING_QUICKTALK_ASSET_ROOT、CUDA 设备和 models/quicktalk/checkpoints。 |
| 首轮等待很久 | 开启 OPENTALKING_QUICKTALK_WORKER_CACHE=1 或提前执行 opentalking-prepare-cache。 |
| avatar 加载失败 | 检查 avatar 是否能被服务读取;如配置了固定模板视频,确认路径可访问。 |
| Hugging Face 下载失败 | 配置 HF_ENDPOINT 或先离线下载后同步到同样目录。 |