Human-in-the-Loop

人在回路的两维分类法

不抄行业流行的 4-verb 列表。omne_harness 把 HITL 视作 D1 触发主体 × D2 决策效力作用范围 的两维正交问题, 6 cell 全满、无 leakage。

§ 01 — 顶层立场

为何是两维坐标系,而不是 4-verb 列表

读这层先于读用例。整张图的承重点不是任何一条 UC,而是「换坐标系」这个决定。

业界流行的 approve / edit / review / validate 其实是三轴混合体,把「人做什么 × 中断在哪 × 怎么传输」压进了一个维度。

照搬它,就会继承它的 leakage。omne 改用两条真正正交的轴:谁发起这次交互,与决策作用到哪。两轴可分别独立讨论,扩展任一轴的取值不动另一条,这是「正交」的工程含义。

而行业三大空白(agent-to-agent escalation / async out-of-band / circuit-breaker 硬底线)正好被这套坐标系显式吸纳为三个增量位置,不再漂移。

业界 4-verb · LangGraph3 轴混合

approve edit review validate

其 docs 内部对后两 pattern 命名漂移,正是「不正交」的自证。

omne · 2D 正交D1 × D2

D1 触发主体:谁发起这次 HITL 交互(主体性)。
D2 响应效力作用范围:本次决策作用到哪(时间性)。

两轴交出 3 × 2 = 6 个 cell,MECE 全满。

开源 framework 调研

LangGraph 4-pattern 实为 what / where / how 三轴混合,命名漂移说明分类不正交。

商业 CLI 调研

共识 3 正交范式 + 三档 allow/ask/deny;三档下放实施层,不进分类轴。

学术 + 标准化

Parasuraman 2000「4 阶段 × LoA」二维网格,给出学术正交分类范本,D1×D2 直接对位。

§ 02 — 网格与用例

3 × 2 网格里的 13 条用例

列是 D1 触发主体(A1 agent 索取 / A2 user 抢断 / A3 system 强制), 行是 D2 作用域(D2.a ephemeral / D2.b 持久)。 点任一用例,看它的迷你状态机如何演出三态流,以及它落在哪条 BC 支撑链上。

A1 · agent 索取 A2 · user 抢断 A3 · system 强制 D2.a 一次性 D2.b 升格为策略
§ 03 — 承重墙

BC-5 permission 扛着整张图

按「谁是 owner」的 in-degree 排,BC-5 一个人扛了 6 条 UC。任何对 HITL 的系统改动几乎都得动它,它准备好了没,直接决定 MVP 可行性。

6 条 UC 直接 owned-by BC-5(UC-2 / 3 / 10 / 11 / 12 / 13),再加参与 UC-1。 PermissionGrant、HostConsent、HardFloorPolicy、circuit-breaker、AI detector 接入点全汇聚于此。 这是星图的引力中心。

§ 04 — 成对升格

ephemeral 与持久之间,是同一形态的镜像

D2.a 和 D2.b 不是无关两行。许多 UC 是「同一 HITL 形态在两个 D2 值上的镜像」。「决策的重复发生」就是升格信号,把它做成产品级 affordance(「以后都这样吗?」)是巨大的 UX 杠杆。

§ 05 — 留账

本期不落地、需单独议的边界问题

每条留账锚到具体 UC 或 BC,提醒哪块仍是松的。