开发者指南¶
本指南面向向 OmniRT 贡献代码的开发者:想接入新模型、新后端、或者理解运行时内部分层。
- 参与贡献 — 开发环境、测试、PR 流程、文档约定
- 架构说明 — 接口层、engine、executor、middleware、观测与分布式扩展如何协作
- Legacy 优化指南 —
legacy_call家族可用的 offload、layout、量化与 TeaCache 开关 - Benchmark 基线 — bench 场景、JSON 指标和 release 验收口径
- FlashTalk Resident Benchmark —
Ascend 910B2 x8上 resident 常驻链路的首轮真机性能结果 - FlashHead Benchmark —
soulx-flashhead-1.3b在 OmniRTsubprocess包装路径下的首轮真机结果 - 模型接入 — 如何把一个新模型族注册进 registry 并通过校验
- 后端接入 — 如何实现
BackendRuntime把新硬件接进来