episteme

Latest Release License Unique Clones

English한국어Español中文

epistemekernel.com

episteme 是一种思考方式 —— 생각의 틀 —— 一台让 AI 辅助决策在落地之前先挣得自身置信度的认识引擎(epistemic engine)。

一套五阶段的认知实践 —— Frame(立框)→ Decompose(分解)→ Execute(执行)→ Verify(验证)→ Handoff(交接) —— 锚定于 Kahneman 的 System-2 强制、Dalio 的 Radical Transparency、Boyd 的 OODA Orientation、Munger 的 Latticework of Mental Models。v2.0 把它交付为三层。认知(Cognition) —— 资深研究者式的审问(interrogation):把承重决策分解为分级的主张(measured / cited / inferred / assumed),在从未见过草稿的全新上下文中、针对外部证据验证承重主张,论证最强的反方立场,指出最薄弱的一环,并预先承诺一个反证条件。结构(Structure) —— 确定性 hooks:路由决策形态、校验裁决工件(stop 裁决以关闭状态失败)、只对真正破坏性的操作硬阻断;由操作者签名的 Reasoning Surface(Ed25519,在结构上位于代理无法触及之处)仍是操作者侧的立框工件。记忆(Memory) —— 来自已验证审问的经验教训成为哈希链接、按上下文限定的协议,在下一个匹配的决策处重新浮现。这套分工不是我们定的,而是研究记录定的:评判自己草稿的模型会变得更差,形式检查会被推理形状的 token 攻破,只有架构性约束能把认识上的自觉转化为行为。

MIRROR 基准(arXiv 2604.19809)了结了这个经验问题:在 8 个实验室的 16 个模型、约 250,000 个实例上,"向模型提供其自身的校准分数不会带来显著改善;只有架构性约束才有效。" 在外部架构性约束下,Confident Failure Rate 从 0.60 降到 0.14。实践本身就是产品。 core/src/episteme/ 之下的产物,是让实践在前沿模型强度下、当作为意志力的警惕崩溃时仍能存活的强制几何(enforcement geometry)。

docs/THE_WAY_TO_THINK.md —— 被操作化的实践。


为什么 prompt 不是真理

你对代理说:"评估我们的 retrieval-augmented memory(RAG)系统是否真的在提升响应质量。"

代理把你的 prompt 当作测量任务。它从过去 30 天的指标里取数据,对比有/无记忆系统的响应样本,发现 thumbs-up 率上有 7% 的正向 lift,写出一份备忘录结论:"记忆系统有效;继续推进。"你读完它。

代理没有问你在不那么疲惫的时候本来会问的问题:

天真的代理因为 prompt 要求测量,就给出听起来像测量的答案。episteme 强制代理在备忘录提交之前——在磁盘上——写下:测量实际在测什么、声称的是什么机制、什么可观察的结果会推翻这个声称。写下来这个行为本身把"代理指标不等于问题本身"这件事浮上来。

近期学术工作把代理在上下文中实际所知、你的意图、与系统真实状态之间累积的差距称为 Epistemic Drift(认识论漂移)episteme 通过结构化地要求代理在行动前推理 什么 · 为什么 · 怎么 来弥合这个差距。


为什么 prompt 还不够

更深的问题是:代理即便在用户自己的请求是错的时候,也照样执行。用户也可能缺乏深度、产生误解、从错误的前提出发。好的系统不止监督代理,还要验证用户的提问本身。Prompt 层的补丁无法结构化这种双向验证。


解法——在文件系统层的 Thinking Framework

episteme 拦截意图遇见状态变更的那一刻。在任何高影响操作(git pushnpm publishterraform apply、DB 迁移、lockfile 编辑)之前——无论这个请求是发出的(用户本人,还是代理自己)——代理都必须把自己的推理明确地投射到磁盘上的一个四字段 Reasoning Surface 里:

字段代理必须声明的内容
Core Question这个动作真正在回答的那一个问题(对抗 question substitution)
Knowns已核实的事实、引用、测量值——不是听起来合理的猜测
Unknowns已命名、可分类的缺口——不是含糊的 "可能有风险"
Assumptions承重的信念,标注出来以便被证伪
Disconfirmation证明此计划错了的可观测事件——在行动前预先承诺

有效性结构化校验:最小内容长度、禁止懒惰占位符(nonen/atbd해당 없음)、规范化命令扫描。如果 surface 缺失或空洞,操作以 exit 2 被拒绝。

这就是 prompt 提醒和编译器的区别:一个在请求,一个在拒绝推进。


ABCD——四个 Cognitive Blueprints

每个高影响操作会触发四个 Blueprint 之一,每一个都对应一类特定的失败模式:

每一次 Blueprint 触发、以及它所验证的每一个决定,都会被提交到一条防篡改的哈希链(tamper-evident hash chain)。这条链不是日志——它是 kernel 之后提供 Active Guidance 的方式:在下一次匹配的决策点,相关的合成 protocol 会在代理退回到训练分布之前,主动浮现出来。

结果是随你的项目不断累积的 Thinking Framework。每次代理解决一次冲突,它对你的代码库都变得更敏锐——不是因为你训练它,而是因为链替你记住了。


零信任执行

OWASP Top 10 for Agentic Applications (2026) — 由 100 多位业界专家同行评议 — 将 prompt injection、goal hijacking、overreach、memory poisoning、unbounded action 列为自主代理的主要风险类别。Knowns / Unknowns / Assumptions / Disconfirmation 结构对每一项都是结构性反制:

OWASP Agentic Risk (2026)episteme 的反制
直接目标操纵 / prompt injection执行前声明 Core Question;偏差以 Unknowns 形式浮现
间接指令注入Knowns / Disconfirmation 将可信状态与 prompt 内容分离;代理在依据检索到的输入行动之前承诺一个可证伪的结果
Overreach / unbounded action在 Frame 中声明约束规则;强制 reversible-first 策略
流畅幻觉Unknowns 字段不可为空;行动前必须命名假设
内存投毒Pillar 2 hash-chained protocols — append-only、tamper-evident;对先前状态的静默重写由 verify_chain 检测
无限规划循环Disconfirmation 条件必填;证据触发时循环退出

未命名的假设不被信任。未声明前提条件 (Knowns) 与约束规则之前不采取任何行动。kernel 是意图与执行之间的验证层。

业界收敛 — 2025–2026

同一时间窗内的主要框架与学术论文,正向 kernel 已交付的相同架构模式收敛:文件系统层的 pre-invocation checkpoint (Capsule Security ClawGuard, 2026)、hash-chained 防篡改内存 (SSGM — Lam et al., 2026)、基于理由而非规则清单的对齐 (Anthropic Claude Constitution, 2026-01-22)、带治理层的五阶段认知循环 (SCL R-CCAM — Kim, 2025)、五支柱 agent integrity (Proofpoint Agent Integrity Framework 2026)。kernel 早于这些出版物 (CP1 于 2026-04-21 交付;v1.0.0 GA 于 2026-04-28);这种收敛是独立验证,并非血统。完整 attribution map 见 kernel/REFERENCES.mdConvergent contemporary work 章节。


Cognitive Arms — v1.1+

上述四个 Blueprint 和三个 Pillar — Cognitive Blueprints · Append-Only Hash Chain · Framework Synthesis & Active Guidance — 是 v1.0 不变的结构基础。Pillar 不会移动。v1.1 在其之上加入了 3 Cognitive Arms:随着时间推移、不断重构 kernel 自身知识的流动型主动引擎。

这个区分承载结构性意义 — Pillar 是已沉淀的术语,Arm 是系统跨越时间审计和打磨自己输出的方式。状态:v1.4.0-rc1 于 2026-05-23 切出,1170 tests + 54 subtests 通过。Arm A 基础设施已交付(supersede-with-history 基础设施 + 将 operator profile / policy 编辑自动记录到 chain stream 的 hook);Arm A 剩余工作伺机恢复。Arm B substrate-facing 形态在 Event 129 正式 SUNSET — 其前提(稳定的模型能力差距)已被 Event 119–120 饱和发现证伪。其 operator-facing 残留(core/ptsp/ typed Fact/Inference 提升门)通过 episteme practice trace 保留可达。Arm C 已 scope 到未来周期,等待 substrate-gap 主张存活的证据。


快速开始

方式 A — Claude Code 插件市场

在 Claude Code 里:

/plugin marketplace add junjslee/episteme
/plugin install episteme@episteme

然后在任意 shell:

episteme init     # 从模板种子化个人记忆文件
episteme setup    # 对工作风格 + 认知风格进行打分
episteme sync     # 传播到 Claude Code 和 Hermes
episteme doctor   # 验证连接

方式 B — 直接克隆 kernel

git clone https://github.com/junjslee/episteme ~/episteme
cd ~/episteme
pip install -e .

episteme init
episteme setup . --write
episteme sync
episteme doctor

更深入的 onboarding:docs/SETUP.md。完整命令参考:docs/COMMANDS.md


哲学——doxa · episteme · praxis · 결

仓库名来自希腊语:

韩语 gyeol)命名木材或石头的纹理——潜在的模式结构,顺着它切会形成连贯的形态,逆着它切则会断裂。Reasoning Surface 的字段顺序正是认识论纪律的 gyeol已确立 → 开放 → 暂定 → 证伪条件


下一步阅读

主题位置
Kernel 30 行蒸馏kernel/SUMMARY.md
v1.0 RC 设计方向docs/DESIGN_V1_0_SEMANTIC_GOVERNANCE.md
11 个 failure mode 及其反制 artifactkernel/FAILURE_MODES.md
同一个 prompt,Thinking Framework 关 vs. 开demos/03_differential/
何时 kernel 是错的工具kernel/KERNEL_LIMITS.md
每一个借用概念的出处kernel/REFERENCES.md
仓库对代理的运营契约AGENTS.md

为什么是 episteme——一句话

姿态高于 prompt(Posture over prompt)。不是寻找更好的措辞,而是在文件系统层面建立 AI 代理思考的框架。一个可以像编译器那样拒绝继续推进的 Thinking Framework。它不是让你的代理更聪明——而是让这份聪明落地到你的上下文里

Built as a Sovereign Cognitive Kernel — 생각의 틀.


Note on translation. This README is a focused-scope Chinese adaptation maintained alongside the canonical English README.md. For deepest documentation, demo walkthroughs, and architectural diagrams, refer to the English docs tree. Technical terms (Thinking Framework, Reasoning Surface, Blueprint, Core Question, Chesterton's fence, Pillar 3, flaw_classification, etc.) are kept in English because they are load-bearing kernel vocabulary.