Agentic AI 教程

4.8 开发过程总结

总结Agentic AI系统开发的流程与迭代循环,强调分析与构建的平衡。

4.8 开发过程总结

对于我们开发者而言,在开发Agent工作流时,主要精力通常集中在以下两项活动中,并不断来回切换:

  • 构建: 编写软件和代码来改进系统。
  • 分析: 决定下一步将构建精力集中在哪里的过程,其重要性与构建相当。

而一个Agent系统从初始原型到成熟,分析工作的严谨性也随之提高,通常经历以下迭代阶段:

阶段描述主要活动
1. 快速原型快速构建一个端到端系统(所谓的“先做个垃圾出来”)。分析: 手动检查最终输出,通读追踪 (Traces),凭直觉找出性能不佳的组件。
2. 初步评估系统开始成熟,超越纯手动观察。分析: 构建初步的 端到端评估 (Evals),使用小型数据集(如 10-20 例)计算整体性能指标。
3. 严谨分析系统需要更精确的改进方向。分析: 进行错误分析,统计和量化各个组件导致次优输出的频率,以做出更集中的决策。
4. 高效调优系统进一步成熟,需要在组件级别进行高效改进。分析: 构建组件级评估,以便更高效地对单个组件进行调优。

显然,开发是一个非线性的过程,需要在调整系统、错误分析、改进组件和调整评估之间反复横跳。

许多经验不足的团队往往花太多时间在构建上,而太少时间在分析上,导致工作重点不集中,效率低下。

在早期,市面上有许多工具可以帮助监控追踪、记录运行时、计算成本等。团队可以尽情使用这些前人造的轮子。但由于大多数Agent工作流程是高度定制化的,所以团队最终仍需要自行构建许多定制化的评估,以准确捕捕获系统特有的问题。

本模块希望带来的核心认知,就是一套系统化的开发流程(评估,错误分析,改进)。只有这种系统化的开发流程,才能支撑起足够复杂的Agent系统。

在下一模块,我们会了解到更高级的设计模式。

On this page