可归因证据的分级与门槛

principle lesson 机制可归因的最小证据包长寿候选因果强度比较 rubric 干预特异性与机制可归因规则

修改：20260425195924000

可归因证据的分级与门槛

''总原则'': 机制可归因不是二值判断，而是从“仅见表型”逐级升级到“可把表型归给候选本体”的证据阶梯。这个阶梯应与机制可归因的最小证据包对齐，并在长寿候选因果强度比较 rubric 中作为统一门槛使用。

建议分级

# ''L0 相关级'': 只有干预后表型，没有明确对象，也没有 target engagement。只能说“有关联”，不能说“命中”。
# ''L1 命中级'': 明确对象 + target engagement 已证实，但还缺少方向一致的下游 readout。适合进入候选池，不足以判定机制。
# ''L2 可归因最低合格级'': L1 基础上，再有方向一致的下游 readout，并且至少排掉一个更简单、更近端或更广谱的替代解释。此时才可称“机制可归因的最低门槛已过”。
# ''L3 强可归因级'': 在 L2 基础上，再加入正交扰动、rescue、剂量-反应或时序证据，表明候选本体不是单纯旁路标签。
# ''L4 稳健级'': 经过独立复现或跨模型复核后，仍保持同方向结论；适合支撑较强主轴判断。

门槛规则

# 若只有 L0/L1，则在长寿候选因果强度比较 rubric 中只能算“观察到信号”，不能升级为机制核心。
# L2 是“可以比较”的最低线，但对多靶点、广谱与 pleiotropic 干预的降权规则所覆盖的候选，应默认按低档处理，直到补到 L3。
# L3 才足以让候选在同一组织、同一终点、同一语境下进入较认真比较。
# L4 才适合把“机制解释”上升为“较稳健的因果主张”。

用途门槛（新增）

证据分级不只决定“像不像机制”，还决定“能不能支持决策”。因此每一级都应显式绑定用途：

# ''hypothesis-generating'': 仅限 L0/L1。可用于提出候选，但不足以做主路线排序。
# ''decisionable minimum'': 至少 L2。可进入同语境、同终点的候选比较，但仍需保守对待多靶点/广谱干预。
# ''comparison-worthy'': L3。可用于认真比较谁更接近候选本体，而不是仅仅“表型更像”。
# ''claim-stable'': L4。可把机制解释写成较稳健主张。

实操顺序

先看对象是否明确，再看 target engagement，再看下游方向，最后做替代解释排查；若候选本身是多靶点/广谱/pleiotropic，则必须额外要求更高一档证据来抵消默认降权。

经验性锚点

临床药理与生物标志物文献常把证据分成 fit-for-purpose、proof-of-mechanism、proof-of-concept 等层次；对应到这里，可把它们理解为从 L1 走向 L3/L4 的不同台阶，而不是同一级别的“机制证明”。刚做的 PubMed 试探没有直接命中这一套术语组合，但它支持一个更稳妥的用法：不要把术语相似性误当成证据等级相同。

与现有规则的接口

机制可归因的最小证据包定义了“必须有什么字段”；本条定义的是“这些字段各自达到什么强度才算过线”。因此它是打分器，不是字段表。

续写 · Iter-0119

证据分级不能只问“有没有变化”，而要先问“这条证据要支持什么决策”。探索性信号最多算 hypothesis-generating；只有在机制可归因的最小证据包补齐、且读出达到 fit-for-purpose / decisionable 的用途门槛后，才可以上升为可用于 go/no-go 的证据。