OmniRT¶

OmniRT 是独立的多模型推理运行时。OpenTalking 可以通过 OmniRT 的 audio2video WebSocket 路由接入 FlashTalk、MuseTalk、Wav2Lip、QuickTalk 等模型。

OpenTalking 与 OmniRT 的边界¶

OpenTalking 负责：

OmniRT 负责：

配置统一入口：

export OPENTALKING_OMNIRT_ENDPOINT=http://127.0.0.1:9000

指定模型走 OmniRT：

export OPENTALKING_QUICKTALK_BACKEND=omnirt
export OPENTALKING_FLASHTALK_BACKEND=omnirt

也可以在配置文件中写：

omnirt_endpoint: http://127.0.0.1:9000
models:
  quicktalk:
    backend: omnirt
  flashtalk:
    backend: omnirt

OpenTalking 默认会按 /v1/audio2video/{model} 派生 WebSocket 地址。如果 OmniRT 路由不同，可以调整：

export OPENTALKING_OMNIRT_AUDIO2VIDEO_PATH_TEMPLATE=/v1/audio2video/{model}

OpenTalking 会根据 OmniRT 的模型列表判断模型是否在线。常用检查：

bash scripts/quickstart/status.sh

如果模型列表路径不同，可以配置：

export OPENTALKING_OMNIRT_AUDIO2VIDEO_MODELS_PATH=/v1/audio2video/models

确认 OmniRT 已启动、模型权重加载成功、端口可访问，并检查模型列表路径是否匹配。

当 OMNIRT_ENDPOINT 存在时，它优先于旧的 *_WS_URL。如果想使用 direct_ws，请把对应模型后端改成 direct_ws。

首次请求可能包含模型加载、Avatar 预处理和缓存构建。Wav2Lip 可通过 OPENTALKING_WAV2LIP_PRELOAD 在 unified 启动时预加载部分资产。