LangGraph 中 checkpoint_id 的更新时机：每个对话轮次还是每个节点流转？

在使用 LangGraph 构建多轮对话或工作流时，我们经常会遇到 checkpoint（检查点）的概念。每个检查点都有一个唯一的 checkpoint_id，用于标识该次状态快照。一个常见的问题是：checkpoint_id 是在每个对话轮次更新一次，还是在节点（node）之间流转时就会更新一次？

本文将通过分析 LangGraph 源码（基于 langgraph==0.2.0 左右版本）来回答这个问题，并解释其背后的设计逻辑。

1. checkpoint_id 是如何生成的？

首先，我们来看 checkpoint_id 的生成方式。在 langgraph/checkpoint/base/__init__.py 中，有一个 create_checkpoint 函数：

def create_checkpoint(
    checkpoint: Checkpoint,
    channels: Mapping[str, BaseChannel] | None,
    step: int,
    *,
    id: str | None = None,
    updated_channels: set[str] | None = None,
) -> Checkpoint:
    # ...
    ts = datetime.now(timezone.utc).isoformat()
    return Checkpoint(
        v=LATEST_VERSION,
        ts=ts,
        id=id or str(uuid6(clock_seq=step)),   # 关键行
        channel_values=values,
        channel_versions=checkpoint["channel_versions"],
        versions_seen=checkpoint["versions_seen"],
        updated_channels=None if updated_channels is None else sorted(updated_channels),
    )

可以看到，如果未提供 id，则会调用 uuid6(clock_seq=step) 生成一个新的 ID。这里的 step 是一个整数，代表 Pregel 循环的迭代次数。

uuid6 是 UUID version 6 的实现，其 clock_seq 参数用于保证同一时刻生成的 UUID 的唯一性和单调递增性。因此，checkpoint_id 与 step 直接相关。

2. step 何时递增？

step 的定义在 langgraph/pregel/_loop.py 的 PregelLoop 类中。在 _put_checkpoint 方法中，每当创建一个新的检查点（非 exiting 情况）后，step 会自增 1：

def _put_checkpoint(self, metadata: CheckpointMetadata) -> None:
    # ...
    if not exiting:
        # ...
        self.step += 1

那么，何时会调用 _put_checkpoint 创建检查点呢？ 主要有三种情况：

输入时（source: "input"）：当外部输入首次进入图时，会创建一个输入检查点。
每个循环迭代（superstep）完成后（source: "loop"）：Pregel 模型在每个 superstep 中并行执行所有准备好的节点，执行完毕后会创建检查点。
中断或恢复时（如 source: "update" 或 "fork"）：当图被中断（interrupt）或手动更新状态时。

3. 节点之间流转会创建检查点吗？

在同一个 superstep 中，可能有多个节点被调度执行（例如，并行执行的节点）。这些节点之间的状态流转不会触发检查点的创建。因为检查点只在 superstep 的边界（即一次迭代完成）时才会创建。

这意味着，checkpoint_id 不会在节点之间流转时更新，它只会在进入下一个 superstep（或输入/中断）时更新。

4. 一个对话轮次对应几个检查点？

这取决于图的结构：

如果图是线性的（无循环），一次 invoke 通常只包含一个 superstep，因此只会产生一个检查点（输入检查点可能也算，但最终输出对应一个 loop 检查点）。
如果图包含循环（例如，通过 add_edge 形成循环），一次 invoke 可能会经历多个 superstep，每个 superstep 结束后都会创建一个新的检查点，checkpoint_id 也会随之更新。

因此，“每个对话轮次” 这个说法不够精确。更准确的说法是：checkpoint_id 在每个 superstep 结束后更新一次。

5. 源码中的证据

我们可以在 _loop.py 的 after_tick 方法中看到，每次 tick（即一个 superstep）结束后都会调用 _put_checkpoint：

1
2
3

def after_tick(self) -> None:
    # ...
    self._put_checkpoint({"source": "loop"})

而在 tick 方法中，节点执行是批量进行的，执行过程中不会插入检查点。

6. 总结

checkpoint_id 由 uuid6(clock_seq=step) 生成，其中 step 是 Pregel 循环的迭代次数。
检查点在以下时机创建：
- 输入时
- 每个 superstep 完成后
- 中断/恢复时
在同一个 superstep 内，节点之间流转不会创建检查点，因此 checkpoint_id 保持不变。
checkpoint_id 的更新频率取决于 superstep 的数量，而不是节点数量或对话轮次。

所以，回答标题中的问题：checkpoint_id 是在每个 superstep 更新一次，而不是在节点之间流转时更新。 如果你的一次对话（一次 invoke）只包含一个 superstep，那么 checkpoint_id 只会更新一次；如果包含多个 superstep，则会更新多次。