可归因证据的分级与门槛
principle lesson 机制可归因的最小证据包 [[长寿候选因果强度比较 rubric ]] 干预特异性与机制可归因规则
可归因证据的分级与门槛
''总原则'': 机制可归因不是二值判断,而是从“仅见表型”逐级升级到“可把表型归给候选本体”的证据阶梯。这个阶梯应与 机制可归因的最小证据包 对齐,并在 长寿候选因果强度比较 rubric 中作为统一门槛使用。
建议分级
# ''L0 相关级'': 只有干预后表型,没有明确对象,也没有 target engagement。只能说“有关联”,不能说“命中”。
# ''L1 命中级'': 明确对象 + target engagement 已证实,但还缺少方向一致的下游 readout。适合进入候选池,不足以判定机制。
# ''L2 可归因最低合格级'': L1 基础上,再有方向一致的下游 readout,并且至少排掉一个更简单、更近端或更广谱的替代解释。此时才可称“机制可归因的最低门槛已过”。
# ''L3 强可归因级'': 在 L2 基础上,再加入正交扰动、rescue、剂量-反应或时序证据,表明候选本体不是单纯旁路标签。
# ''L4 稳健级'': 经过独立复现或跨模型复核后,仍保持同方向结论;适合支撑较强主轴判断。
门槛规则
# 若只有 L0/L1,则在 长寿候选因果强度比较 rubric 中只能算“观察到信号”,不能升级为机制核心。
# L2 是“可以比较”的最低线,但对 多靶点、广谱与 pleiotropic 干预的降权规则 所覆盖的候选,应默认按低档处理,直到补到 L3。
# L3 才足以让候选在同一组织、同一终点、同一语境下进入较认真比较。
# L4 才适合把“机制解释”上升为“较稳健的因果主张”。
用途门槛(新增)
证据分级不只决定“像不像机制”,还决定“能不能支持决策”。因此每一级都应显式绑定用途:
# ''hypothesis-generating'': 仅限 L0/L1。可用于提出候选,但不足以做主路线排序。
# ''decisionable minimum'': 至少 L2。可进入同语境、同终点的候选比较,但仍需保守对待多靶点/广谱干预。
# ''comparison-worthy'': L3。可用于认真比较谁更接近候选本体,而不是仅仅“表型更像”。
# ''claim-stable'': L4。可把机制解释写成较稳健主张。
实操顺序
先看对象是否明确,再看 target engagement,再看下游方向,最后做替代解释排查;若候选本身是多靶点/广谱/pleiotropic,则必须额外要求更高一档证据来抵消默认降权。
经验性锚点
临床药理与生物标志物文献常把证据分成 fit-for-purpose、proof-of-mechanism、proof-of-concept 等层次;对应到这里,可把它们理解为从 L1 走向 L3/L4 的不同台阶,而不是同一级别的“机制证明”。刚做的 PubMed 试探没有直接命中这一套术语组合,但它支持一个更稳妥的用法:不要把术语相似性误当成证据等级相同。
与现有规则的接口
机制可归因的最小证据包 定义了“必须有什么字段”;本条定义的是“这些字段各自达到什么强度才算过线”。因此它是打分器,不是字段表。
续写 · Iter-0119
证据分级不能只问“有没有变化”,而要先问“这条证据要支持什么决策”。探索性信号最多算 hypothesis-generating;只有在 机制可归因的最小证据包 补齐、且读出达到 fit-for-purpose / decisionable 的用途门槛后,才可以上升为可用于 go/no-go 的证据。