2.3 图表生成工作流

通过咖啡销售数据的实战案例，展示AI如何像人类专家一样“审视”和“改进”自己的工作成果。

2.3 图表生成工作流

如何利用“反思设计模式”结合多模态AI，将一份粗糙的图表初稿，迭代优化为清晰、美观、专业的可视化作品。通过一个咖啡销售数据的实战案例，生动展示了AI如何像人类专家一样“审视”和“改进”自己的工作成果。

直接生成

向 LLM 发送提示：“Create a plot comparing Q1 coffee sales in 2024 and 2025 using coffee_sales.csv.”
LLM 生成第一版 Python 代码（V1 code），用于读取CSV文件并绘制图表。
执行与结果：运行 V1 代码，生成了一张名为 plot.png 的图表。
问题显现：这是一张堆叠柱状图（Stacked Bar Plot）。虽然它完成了数据展示的基本功能，但存在两大缺陷：

堆叠柱状图对于比较不同年份同一饮品的销量不够直观。
图表整体观感不佳，缺乏专业性。

引入反思 —— 多模态模型的视觉推理

将生成的图像作为输入，交由一个多模态语言模型（Multi-modal LLM）进行反思。

输入准备：将 V1 版本的代码 (V1 code) 和它生成的图表 (plot.png) 一同打包，作为新的输入。
反思指令：提示多模态 LLM 扮演“专家数据分析师”的角色，对图表进行批判性评估。
视觉推理：多模态模型能够“真正地看”这张图，分析其可读性、清晰度和完整性，并提出具体的改进建议。
生成新代码：根据反思反馈，模型更新代码，生成第二版（V2 code）。
最终成果：运行 V2 代码，生成了 plot_v2.png。

使用不同的模型进行分工协作

LLM (初始生成)：负责根据用户提示生成第一版代码。例如，可以使用 GPT-4 或 GPT-5 等强大的通用模型。
LLM 2 (反思阶段)：负责接收第一版代码、生成的图表以及对话历史，扮演“专家分析师”的角色，提供建设性反馈并指导代码改进。这个角色可能更适合由具备强大推理能力的“思考模型”（Reasoning Model）来担任。

反思提示语示例：

您是一位专业的数据分析师，能够为可视化提供建设性反馈。
{V1 代码} {plot.png} {对话历史记录}
步骤 1：评估所附图表的可读性、清晰度和完整性。
步骤 2：编写新代码来实现您的改进。

总结：

反思机制并非万能，其效果因应用场景而异。在某些任务上提升显著，在另一些任务上则可能微乎其微。
因此，了解反思机制对你特定应用的影响至关重要。它能为你提供优化方向，无论是调整初始生成提示，还是优化反思提示，都能帮助你获得更好的性能。

2.2 为何不只用迭代

解释为何包含反思步骤的复杂工作流优于直接生成，并介绍了如何编写高效的反思提示语。

2.5 评估反思的影响

介绍如何科学地评估反思带来的实际收益，从而在“性能提升”与“效率损耗”之间做出明智取舍。

On this page

2.3 图表生成工作流

引入反思 —— 多模态模型的视觉推理

使用不同的模型进行分工协作

反思提示语示例：