Local Adapter¶

适合场景¶

Local Adapter 表示模型在 OpenTalking 进程内加载。它适合开发调试、单机 Demo、低并发验证和模型适配开发。

当前主要 local 路径是 Wav2Lip、QuickTalk 和 MuseTalk。MuseTalk local 模式需要 CUDA，以及官方预处理依赖。

优点与限制¶

优点：

启动链路短，便于调试。
不需要单独维护推理服务。
可以直接访问本机 Avatar 和模型文件。

限制：

API 进程会占用 GPU/CPU/内存。
模型依赖会影响 OpenTalking 环境。
多模型或多并发下隔离性较弱。

配置方式¶

通过启动脚本：

bash scripts/start_unified.sh --backend local --model quicktalk

bash scripts/start_unified.sh --backend local --model musetalk

通过环境变量：

export OPENTALKING_MUSETALK_BACKEND=local
export OPENTALKING_QUICKTALK_BACKEND=local
export OPENTALKING_WAV2LIP_BACKEND=local

通过配置文件：

models:
  musetalk:
    backend: local
  quicktalk:
    backend: local
  wav2lip:
    backend: local

模型兼容性¶

模型	local 支持建议
Wav2Lip	推荐用于本地验证
QuickTalk	推荐用于本地 GPU 验证
MuseTalk	支持本地 CUDA 验证；需要权重、MuseTalk 官方源码和 full OpenMMLab 预处理依赖
FlashTalk	更建议走 OmniRT
FlashHead	更建议走独立 HTTP / direct_ws

验证¶

bash scripts/start_unified.sh --backend local --model musetalk --api-port 18000
curl -s http://127.0.0.1:18000/models | jq '.statuses[] | select(.id=="musetalk")'

WebUI 中选择对应模型，使用匹配 Avatar 发送短文本。MuseTalk 会在首次创建会话时检查头像是否已有 prepared/ 资产；没有有效缓存时会先运行官方预处理。

常见问题¶

本地模型加载失败¶

检查模型权重路径、安装 extras、CUDA / PyTorch / ONNX Runtime 版本，以及 OPENTALKING_TORCH_DEVICE。

MuseTalk 预处理失败¶

检查 OPENTALKING_MUSETALK_REPO 是否指向 MuseTalk 官方源码，以及 OPENTALKING_MUSETALK_PREPROCESS_PYTHON 是否安装 full OpenMMLab 依赖，尤其是带 mmcv._ext 的 mmcv。

API 进程启动很慢¶

local 模式需要在进程内加载模型和预处理 Avatar。MuseTalk 在没有有效 prepared/ 缓存时还会先运行官方预处理。首次启动或首次选择 Avatar 时耗时较长是正常的，可以使用预热或缓存参数优化。