FasterLivePortrait¶

模型简介¶

FasterLivePortrait 在 OpenTalking 中通过 OmniRT 接入。当前支持两条链路：

实时对话：OpenTalking 生成语音，OmniRT 通过 /v1/audio2video/fasterliveportrait 做音频驱动数字人。
视频克隆：OpenTalking 固定一个数字人资产作为 source，浏览器摄像头或上传视频作为 driving，通过独立视频克隆 WebSocket 逐帧驱动表情和头动。

视频克隆不会进入 LLM、STT、TTS 对话链路。它是一个实时视觉驱动工作流，用来验证“用我的摄像头表情驱动数字人”的玩法。

先按 FasterLivePortrait 模型部署准备 FasterLivePortrait 源码、JoyVASA 权重、TensorRT/ONNXRuntime 依赖，并启动 OmniRT 与 OpenTalking。

确认 OpenTalking 能看到视频克隆服务：

curl -s http://127.0.0.1:8000/video-clone/status | python3 -m json.tool

期望 connected 为 true。如果为 false，先检查 OmniRT 是否启动 FasterLivePortrait runtime，以及 OMNIRT_ENDPOINT 是否指向正确服务。

source 是 OpenTalking 资产库里的数字人图片。推荐：

在视频克隆页可以直接上传新的 source 图片。上传后 OpenTalking 会复用现有 /avatars/custom 资产入口，把图片加入形象库并固定为当前 source。

driving 是驱动表情和头动的输入，不是 source：

视频克隆页左侧提供驱动参数：

如果嘴部鼓或位置不对，先确认 driving video 是否被裁剪，再尝试关闭裁剪、开启拼回原图，并在“张嘴开合”和“唇形重定向”之间折中。

停止或切换页面后，WebUI 会释放摄像头 track、WebSocket 和当前视频克隆会话。

OpenTalking 入口	OmniRT 入口	用途
`/sessions` + FasterLivePortrait 会话	`/v1/audio2video/fasterliveportrait`	音频驱动实时对话
`/video-clone/fasterliveportrait/ws`	`/v1/avatar/video-clone/fasterliveportrait`	视频克隆帧流