第六篇:推理与 Agent 数据工程¶
本篇定位¶
第六篇面向推理轨迹、Tool-Use、函数调用、Agent 记忆和多轮交互样本,讨论如何把复杂推理与行动过程转化为可训练、可验证、可复盘的数据资产。
术语口径¶
本篇统一使用“推理数据”描述承载解题过程、验证路径或中间状态的样本;使用“工具调用数据(Tool-Use Data)”描述包含工具 schema、调用参数、执行结果和错误恢复的记录;使用“Agent 交互数据”描述带有记忆、状态和多轮行动的轨迹。CoT、函数调用和 Agent 记忆应分别说明监督对象,避免把所有中间过程泛化为“思维链”。
本篇学习目标¶
完成本篇后,应能够:
- 区分最终答案、推理轨迹、过程监督和验证器信号的训练用途。
- 设计包含工具 schema、调用参数、执行反馈和失败恢复的 Tool-Use 数据。
- 组织 Agent 记忆、多轮状态和长程交互轨迹,并记录可审计上下文。
- 判断推理与 Agent 数据是否具备真实性、可验证性和安全边界。
读者前置知识¶
阅读本篇前,建议已经掌握第四篇的监督数据和第五篇的合成数据流程。若读者来自 Agent 应用或工具平台方向,可重点关注样本中的状态、工具、执行结果和审计字段如何共同构成训练信号。
章节逻辑¶
第18章讨论思维链和推理轨迹,回答过程信息如何被采集、筛选和验证。第19章进入 Tool-Use 与函数调用,强调工具 schema、调用约束和执行反馈。第20章把推理与工具扩展到多轮 Agent 交互,重点讨论记忆、状态、长期上下文和数据治理。
本篇目录¶
建议阅读顺序¶
- 先读第18章,理解 CoT 与推理轨迹的样本设计。
- 再读第19章,掌握工具调用、函数签名与执行约束。
- 最后读第20章,延伸到 Agent 记忆、多轮状态与长期交互数据。