episteme 是一种思考方式 —— 생각의 틀 —— 一台让 AI 辅助决策在落地之前先挣得自身置信度的认识引擎(epistemic engine)。
一套五阶段的认知实践 —— Frame(立框)→ Decompose(分解)→ Execute(执行)→ Verify(验证)→ Handoff(交接) —— 锚定于 Kahneman 的 System-2 强制、Dalio 的 Radical Transparency、Boyd 的 OODA Orientation、Munger 的 Latticework of Mental Models。v2.0 把它交付为三层。认知(Cognition) —— 资深研究者式的审问(interrogation):把承重决策分解为分级的主张(
measured / cited / inferred / assumed),在从未见过草稿的全新上下文中、针对外部证据验证承重主张,论证最强的反方立场,指出最薄弱的一环,并预先承诺一个反证条件。结构(Structure) —— 确定性 hooks:路由决策形态、校验裁决工件(stop裁决以关闭状态失败)、只对真正破坏性的操作硬阻断;由操作者签名的 Reasoning Surface(Ed25519,在结构上位于代理无法触及之处)仍是操作者侧的立框工件。记忆(Memory) —— 来自已验证审问的经验教训成为哈希链接、按上下文限定的协议,在下一个匹配的决策处重新浮现。这套分工不是我们定的,而是研究记录定的:评判自己草稿的模型会变得更差,形式检查会被推理形状的 token 攻破,只有架构性约束能把认识上的自觉转化为行为。MIRROR 基准(arXiv 2604.19809)了结了这个经验问题:在 8 个实验室的 16 个模型、约 250,000 个实例上,"向模型提供其自身的校准分数不会带来显著改善;只有架构性约束才有效。" 在外部架构性约束下,Confident Failure Rate 从 0.60 降到 0.14。实践本身就是产品。
core/与src/episteme/之下的产物,是让实践在前沿模型强度下、当作为意志力的警惕崩溃时仍能存活的强制几何(enforcement geometry)。→
docs/THE_WAY_TO_THINK.md—— 被操作化的实践。
为什么 prompt 不是真理
你对代理说:"评估我们的 retrieval-augmented memory(RAG)系统是否真的在提升响应质量。"
代理把你的 prompt 当作测量任务。它从过去 30 天的指标里取数据,对比有/无记忆系统的响应样本,发现 thumbs-up 率上有 7% 的正向 lift,写出一份备忘录结论:"记忆系统有效;继续推进。"你读完它。
代理没有问你在不那么疲惫的时候本来会问的问题:
- 什么 (What) 在这里被当作"质量"测量了?代理选的指标是 thumbs-up 率。但 thumbs-up 与响应的自信度相关,而不是与响应的正确性相关——一个带记忆引用的、自信地错误的答案,会比一个正确地保留了不确定性的答案得到更高的分数。代理测量的是问题的代理指标(proxy),不是问题本身。
- 为什么 (Why) 记忆系统会有帮助?声称的机制是跨会话的稳定上下文。但有/无对比没有控制响应长度——带记忆的响应平均长 30%,而长度本身就与 thumbs-up 独立相关。所谓的 "lift" 可能是长度效应,而不是记忆效应。
- 怎么 (How) 这个结论会被证明是错的?在控制响应长度后重跑。如果 lift 仍然存在,结论成立。如果消失了,那记忆只是加了 token,没有加信号。那就是代理从未明示的反证条件。
天真的代理因为 prompt 要求测量,就给出听起来像测量的答案。episteme 强制代理在备忘录提交之前——在磁盘上——写下:测量实际在测什么、声称的是什么机制、什么可观察的结果会推翻这个声称。写下来这个行为本身把"代理指标不等于问题本身"这件事浮上来。
近期学术工作把代理在上下文中实际所知、你的意图、与系统真实状态之间累积的差距称为 Epistemic Drift(认识论漂移)。episteme 通过结构化地要求代理在行动前推理 什么 · 为什么 · 怎么 来弥合这个差距。
为什么 prompt 还不够
- 系统提示里的提醒只活一次调用。下一次会话里它就不存在了。
CLAUDE.md里写的规则一到 deadline 就会被忽视——人类如此,代理也如此。- Know-how——"在这种形状的问题里,这样做" 这种不可还原地依赖上下文的规则——无法靠更好的措辞来教。它必须被提取、存储、再次显现。
更深的问题是:代理即便在用户自己的请求是错的时候,也照样执行。用户也可能缺乏深度、产生误解、从错误的前提出发。好的系统不止监督代理,还要验证用户的提问本身。Prompt 层的补丁无法结构化这种双向验证。
解法——在文件系统层的 Thinking Framework
episteme 拦截意图遇见状态变更的那一刻。在任何高影响操作(git push、npm publish、terraform apply、DB 迁移、lockfile 编辑)之前——无论这个请求是谁发出的(用户本人,还是代理自己)——代理都必须把自己的推理明确地投射到磁盘上的一个四字段 Reasoning Surface 里:
| 字段 | 代理必须声明的内容 |
|---|---|
| Core Question | 这个动作真正在回答的那一个问题(对抗 question substitution) |
| Knowns | 已核实的事实、引用、测量值——不是听起来合理的猜测 |
| Unknowns | 已命名、可分类的缺口——不是含糊的 "可能有风险" |
| Assumptions | 承重的信念,标注出来以便被证伪 |
| Disconfirmation | 能证明此计划错了的可观测事件——在行动前预先承诺 |
有效性结构化校验:最小内容长度、禁止懒惰占位符(none、n/a、tbd、해당 없음)、规范化命令扫描。如果 surface 缺失或空洞,操作以 exit 2 被拒绝。
这就是 prompt 提醒和编译器的区别:一个在请求,一个在拒绝推进。
ABCD——四个 Cognitive Blueprints
每个高影响操作会触发四个 Blueprint 之一,每一个都对应一类特定的失败模式:
- A · Axiomatic Judgment — 解决可信但相互矛盾的信息源之间的冲突。强制代理说出为什么它们有冲突,以及当前上下文的哪个特征做出选择。
- B · Fence Reconstruction — 保护继承下来的约束。在移除某个约束之前,必须先重建它的原始目的。Chesterton's fence 被文件系统强制执行。
- C · Consequence Chain — 分解不可逆操作(一阶效应、二阶效应、failure-mode 反转、基准率、margin of safety)。
- D · Architectural Cascade — 捕捉那些会留下陈旧引用的重构和重命名。在编辑之前,强制代理枚举完整的 blast radius。
每一次 Blueprint 触发、以及它所验证的每一个决定,都会被提交到一条防篡改的哈希链(tamper-evident hash chain)。这条链不是日志——它是 kernel 之后提供 Active Guidance 的方式:在下一次匹配的决策点,相关的合成 protocol 会在代理退回到训练分布之前,主动浮现出来。
结果是随你的项目不断累积的 Thinking Framework。每次代理解决一次冲突,它对你的代码库都变得更敏锐——不是因为你训练它,而是因为链替你记住了。
零信任执行
OWASP Top 10 for Agentic Applications (2026) — 由 100 多位业界专家同行评议 — 将 prompt injection、goal hijacking、overreach、memory poisoning、unbounded action 列为自主代理的主要风险类别。Knowns / Unknowns / Assumptions / Disconfirmation 结构对每一项都是结构性反制:
| OWASP Agentic Risk (2026) | episteme 的反制 |
|---|---|
| 直接目标操纵 / prompt injection | 执行前声明 Core Question;偏差以 Unknowns 形式浮现 |
| 间接指令注入 | Knowns / Disconfirmation 将可信状态与 prompt 内容分离;代理在依据检索到的输入行动之前承诺一个可证伪的结果 |
| Overreach / unbounded action | 在 Frame 中声明约束规则;强制 reversible-first 策略 |
| 流畅幻觉 | Unknowns 字段不可为空;行动前必须命名假设 |
| 内存投毒 | Pillar 2 hash-chained protocols — append-only、tamper-evident;对先前状态的静默重写由 verify_chain 检测 |
| 无限规划循环 | Disconfirmation 条件必填;证据触发时循环退出 |
未命名的假设不被信任。未声明前提条件 (Knowns) 与约束规则之前不采取任何行动。kernel 是意图与执行之间的验证层。
业界收敛 — 2025–2026
同一时间窗内的主要框架与学术论文,正向 kernel 已交付的相同架构模式收敛:文件系统层的 pre-invocation checkpoint (Capsule Security ClawGuard, 2026)、hash-chained 防篡改内存 (SSGM — Lam et al., 2026)、基于理由而非规则清单的对齐 (Anthropic Claude Constitution, 2026-01-22)、带治理层的五阶段认知循环 (SCL R-CCAM — Kim, 2025)、五支柱 agent integrity (Proofpoint Agent Integrity Framework 2026)。kernel 早于这些出版物 (CP1 于 2026-04-21 交付;v1.0.0 GA 于 2026-04-28);这种收敛是独立验证,并非血统。完整 attribution map 见 kernel/REFERENCES.md 中 Convergent contemporary work 章节。
Cognitive Arms — v1.1+
上述四个 Blueprint 和三个 Pillar — Cognitive Blueprints · Append-Only Hash Chain · Framework Synthesis & Active Guidance — 是 v1.0 不变的结构基础。Pillar 不会移动。v1.1 在其之上加入了 3 Cognitive Arms:随着时间推移、不断重构 kernel 自身知识的流动型主动引擎。
- Arm A · Temporal Integrity — 协议会衰退。经操作员确认的 retire 会 supersede 一条陈旧规则,而不是静默覆盖它。验证窗口:CP-DECAY-03 之后 30 天。
- Arm B · Causal Synthesis — 对 deferred-discovery 流进行零-LLM 实体抽取,产生 framework 可以据此行动的聚类提案。验证窗口:60 天。
- Arm C · Self-Consistency Convergence — 协议升级为以结构化方式推导 disconfirmation 的模型。验证窗口:90 天。
这个区分承载结构性意义 — Pillar 是已沉淀的术语,Arm 是系统跨越时间审计和打磨自己输出的方式。状态:v1.4.0-rc1 于 2026-05-23 切出,1170 tests + 54 subtests 通过。Arm A 基础设施已交付(supersede-with-history 基础设施 + 将 operator profile / policy 编辑自动记录到 chain stream 的 hook);Arm A 剩余工作伺机恢复。Arm B substrate-facing 形态在 Event 129 正式 SUNSET — 其前提(稳定的模型能力差距)已被 Event 119–120 饱和发现证伪。其 operator-facing 残留(core/ptsp/ typed Fact/Inference 提升门)通过 episteme practice trace 保留可达。Arm C 已 scope 到未来周期,等待 substrate-gap 主张存活的证据。
快速开始
方式 A — Claude Code 插件市场
在 Claude Code 里:
/plugin marketplace add junjslee/episteme
/plugin install episteme@episteme
然后在任意 shell:
episteme init # 从模板种子化个人记忆文件
episteme setup # 对工作风格 + 认知风格进行打分
episteme sync # 传播到 Claude Code 和 Hermes
episteme doctor # 验证连接
方式 B — 直接克隆 kernel
git clone https://github.com/junjslee/episteme ~/episteme
cd ~/episteme
pip install -e .
episteme init
episteme setup . --write
episteme sync
episteme doctor
更深入的 onboarding:docs/SETUP.md。完整命令参考:docs/COMMANDS.md。
哲学——doxa · episteme · praxis · 결
仓库名来自希腊语:
- Doxa (δόξα) — 默认产出的流畅意见。
kernel/FAILURE_MODES.md里的 11 个 failure mode 是一个把 doxa 误认为 episteme 的分类学。 - Episteme (ἐπιστήμη) — 可辩护的知识:具体的 Knowns、被命名的 Unknowns、可证伪的 Disconfirmation。执行的前置条件。
- Praxis (πρᾶξις) — 带着授权纪律的行动:效果落地时纪律完好无损。
韩语 결(gyeol)命名木材或石头的纹理——潜在的模式结构,顺着它切会形成连贯的形态,逆着它切则会断裂。Reasoning Surface 的字段顺序正是认识论纪律的 gyeol:已确立 → 开放 → 暂定 → 证伪条件。
下一步阅读
| 主题 | 位置 |
|---|---|
| Kernel 30 行蒸馏 | kernel/SUMMARY.md |
| v1.0 RC 设计方向 | docs/DESIGN_V1_0_SEMANTIC_GOVERNANCE.md |
| 11 个 failure mode 及其反制 artifact | kernel/FAILURE_MODES.md |
| 同一个 prompt,Thinking Framework 关 vs. 开 | demos/03_differential/ |
| 何时 kernel 是错的工具 | kernel/KERNEL_LIMITS.md |
| 每一个借用概念的出处 | kernel/REFERENCES.md |
| 仓库对代理的运营契约 | AGENTS.md |
为什么是 episteme——一句话
姿态高于 prompt(Posture over prompt)。不是寻找更好的措辞,而是在文件系统层面建立 AI 代理思考的框架。一个可以像编译器那样拒绝继续推进的 Thinking Framework。它不是让你的代理更聪明——而是让这份聪明落地到你的上下文里。
Built as a Sovereign Cognitive Kernel — 생각의 틀.
Note on translation. This README is a focused-scope Chinese adaptation maintained alongside the canonical English
README.md. For deepest documentation, demo walkthroughs, and architectural diagrams, refer to the English docs tree. Technical terms (Thinking Framework, Reasoning Surface, Blueprint, Core Question, Chesterton's fence, Pillar 3, flaw_classification, etc.) are kept in English because they are load-bearing kernel vocabulary.