跳转至

开发者指南

本指南面向向 OmniRT 贡献代码的开发者:想接入新模型、新后端、或者理解运行时内部分层。

  • 参与贡献 — 开发环境、测试、PR 流程、文档约定
  • 架构说明 — 接口层、engine、executor、middleware、观测与分布式扩展如何协作
  • Legacy 优化指南legacy_call 家族可用的 offload、layout、量化与 TeaCache 开关
  • Benchmark 基线 — bench 场景、JSON 指标和 release 验收口径
  • FlashTalk Resident BenchmarkAscend 910B2 x8 上 resident 常驻链路的首轮真机性能结果
  • FlashHead Benchmarksoulx-flashhead-1.3b 在 OmniRT subprocess 包装路径下的首轮真机结果
  • 模型接入 — 如何把一个新模型族注册进 registry 并通过校验
  • 后端接入 — 如何实现 BackendRuntime 把新硬件接进来

第一次贡献?

先读 参与贡献架构说明,再按你的目标选 模型接入后端接入