第六篇：推理与 Agent 数据工程¶

本篇定位¶

第六篇面向推理轨迹、Tool-Use、函数调用、Agent 记忆和多轮交互样本，讨论如何把复杂推理与行动过程转化为可训练、可验证、可复盘的数据资产。

术语口径¶

本篇统一使用“推理数据”描述承载解题过程、验证路径或中间状态的样本；使用“工具调用数据（Tool-Use Data）”描述包含工具 schema、调用参数、执行结果和错误恢复的记录；使用“Agent 交互数据”描述带有记忆、状态和多轮行动的轨迹。CoT、函数调用和 Agent 记忆应分别说明监督对象，避免把所有中间过程泛化为“思维链”。

本篇学习目标¶

完成本篇后，应能够：

区分最终答案、推理轨迹、过程监督和验证器信号的训练用途。
设计包含工具 schema、调用参数、执行反馈和失败恢复的 Tool-Use 数据。
组织 Agent 记忆、多轮状态和长程交互轨迹，并记录可审计上下文。
判断推理与 Agent 数据是否具备真实性、可验证性和安全边界。

读者前置知识¶

阅读本篇前，建议已经掌握第四篇的监督数据和第五篇的合成数据流程。若读者来自 Agent 应用或工具平台方向，可重点关注样本中的状态、工具、执行结果和审计字段如何共同构成训练信号。

章节逻辑¶

第18章讨论思维链和推理轨迹，回答过程信息如何被采集、筛选和验证。第19章进入 Tool-Use 与函数调用，强调工具 schema、调用约束和执行反馈。第20章把推理与工具扩展到多轮 Agent 交互，重点讨论记忆、状态、长期上下文和数据治理。

本篇目录¶

建议阅读顺序¶

先读第18章，理解 CoT 与推理轨迹的样本设计。
再读第19章，掌握工具调用、函数签名与执行约束。
最后读第20章，延伸到 Agent 记忆、多轮状态与长期交互数据。