episteme

Latest Release License Unique Clones

English한국어Español中文

epistemekernel.com

episteme는 사고법입니다 — 생각의 틀 — AI 보조 의사결정이 실행되기 전에 자신의 확신을 스스로 증명하게 만드는 인식 엔진(epistemic engine).

다섯 단계의 인지 실천 — Frame(틀잡기) → Decompose(분해) → Execute(실행) → Verify(검증) → Handoff(인계) — Kahneman의 System-2 강제, Dalio의 Radical Transparency, Boyd의 OODA Orientation, Munger의 Latticework of Mental Models에 닻을 둡니다. v2.0은 이를 세 개의 층으로 전달합니다. 인지(Cognition) — 시니어 연구자의 심문(interrogation): 하중을 받는 결정을 등급화된 주장들로 분해하고(measured / cited / inferred / assumed), 하중을 받는 주장들을 초안을 본 적 없는 새로운 컨텍스트에서 외부 증거에 대해 검증하고, 가장 강한 반론을 논증하고, 가장 약한 고리를 지목하고, 반증 조건을 사전에 약속합니다. 구조(Structure) — 결정의 형태를 라우팅하고, 평결 아티팩트를 검증하며(stop 평결은 닫힌 채로 실패), 진짜 파괴적인 작업만 하드 블록하는 결정론적 훅들; 운영자가 서명한 Reasoning Surface(Ed25519, 구조적으로 에이전트의 손이 닿지 않는)는 운영자 측 프레이밍 아티팩트로 남습니다. 기억(Memory) — 검증된 심문에서 나온 교훈이 해시 체인으로 연결된 컨텍스트 범위의 프로토콜이 되어, 다음 일치하는 결정에서 다시 떠오릅니다. 이 분업은 우리가 아니라 연구 기록이 정한 것입니다: 자기 초안을 스스로 판정하는 모델은 더 나빠지고, 형식 검사는 추론 모양의 토큰에 뚫리며, 오직 아키텍처적 제약만이 인식적 자각을 행동으로 바꿉니다.

MIRROR 벤치마크(arXiv 2604.19809)가 경험적 질문을 결론지었습니다: 8개 랩 16개 모델, 약 250,000개 인스턴스에서 "모델에게 자신의 캘리브레이션 점수를 제공하는 것은 유의미한 개선을 주지 않는다; 오직 아키텍처적 제약만이 효과적이다." Confident Failure Rate는 외부 아키텍처적 제약 하에서 0.60에서 0.14로 떨어집니다. 실천 자체가 제품입니다. core/src/episteme/ 아래의 산물들은, 프론티어 모델 강도에서 의지력으로서의 경계심 이 무너질 때 실천이 살아남도록 하는 강제 기하학(enforcement geometry)입니다.

docs/THE_WAY_TO_THINK.md — 운영화된 실천.


왜 프롬프트만으로는 사고법을 강제할 수 없는가

docs/THE_WAY_TO_THINK.md에 명시된 실천은 모든 고위험 의사결정당 여섯 가지 인지 행위를 명명합니다 — Core Question, 구분 맵(Knowns/Unknowns/Assumptions), Signal-vs-Noise 필터, because-chain, hypothesis-as-bet, disconfirmation conditions. 각 행위는 명명된 System-1 실패 모드(question substitution, WYSIATI, anchoring, narrative fallacy, planning fallacy, overconfidence — Kahneman)에 대한 구조적 반례입니다. 프롬프트는 이 행위들을 요청할 수는 있지만, 프롬프트는 권고일 뿐입니다: 한 번의 호출만 살고, 마감 앞에서 무시되며, 컨텍스트에서 사라집니다. 프론티어 모델은 표면적으로 순응하면서 그 아래의 인지 행위들을 건너뜁니다 — 유창하게, 자신감 있게. 그리고 운영자는 검토를 멈춥니다. 정확히 이것이 실천이 존재하는 이유의 실패 모드입니다.

구체적 예시. 당신이 에이전트에게 말한다: "우리가 도입한 RAG(검색-증강 메모리) 시스템이 실제로 응답 품질을 개선했는지 평가해줘."

에이전트는 당신의 프롬프트를 측정 과제로 받아들인다. 지난 30일 메트릭을 끌어와 메모리-사용 / 메모리-미사용 응답 샘플을 비교한다. thumbs-up 비율에서 7%의 양(+)의 lift를 발견한다. "메모리 시스템 효과 있음; 계속 출하" 라는 결론의 메모를 쓴다. 당신은 그것을 읽는다.

에이전트는 당신이 피곤하지 않았다면 당연히 던졌을 질문들을 묻지 않았다:

순진한 에이전트는 프롬프트가 측정을 요청했기 때문에 측정처럼 들리는 답을 준다. episteme는 메모가 제출되기 전에 — 디스크에 — 측정이 실제로 무엇을 측정하는지, 어떤 메커니즘이 주장되는지, 어떤 관측 가능한 결과가 그 주장을 반증할지 적도록 강제한다. 적는 행위 자체가 그 대리지표가 질문이 아니었음을 표면화한다.

최근 학계에서는 에이전트와 사용자가 반복적 상호작용을 거치며 에이전트가 맥락에서 실제로 아는 것, 당신이 의도한 것, 시스템의 실제 상태 사이에 누적되는 간격을 Epistemic Drift (인식론적 표류) 라고 부른다. 한 번의 큰 실수가 아니라 수많은 작은 엇나감의 누적 — 자정 무렵 당신이 에이전트의 답에 고개를 끄덕이고 프로덕션에 반영한 그 순간, 드리프트는 이미 수십 번 일어난 후다. episteme는 에이전트가 행동하기 전에 무엇 · 왜 · 어떻게 를 구조적으로 추론하도록 요구함으로써 그 간격을 닫는다.


왜 프롬프트만으로는 부족한가

수많은 대응책이 더 나은 프롬프트를 제안한다. 그것도 해결책이긴 하지만, 얕다:

더 깊은 문제는 이거다. 에이전트가 당신 자신의 요청이 틀렸을 때도 그대로 수행한다는 것. 사용자도 지식의 깊이가 부족할 수 있고, 오해할 수 있고, 잘못된 전제로 질문할 수 있다. 좋은 시스템은 에이전트만 감시하는 게 아니라 사용자의 질문 자체도 검증해야 한다. 프롬프트 수준의 대응책은 이 양방향 검증을 구조화하지 못한다.


해법 — 파일 시스템 수준의 Thinking Framework

episteme의도가 상태 변화와 만나는 순간을 가로챈다. git push, npm publish, terraform apply, DB 마이그레이션, lockfile 편집 등 모든 고위험 작업 이전에 — 그 작업을 누가 요청했든 (당신이든, 에이전트 스스로든) — 에이전트는 디스크 위에 자신의 추론을 명시적으로 투영해야 한다.

네 개의 필드를 가진 Reasoning Surface가 그 형식이다:

필드에이전트가 기록해야 하는 것
Core Question이 작업이 실제로 답하려는 단 하나의 질문 (question substitution 실패모드 대응)
Knowns검증된 사실, 출처, 측정값 — 그럴듯한 추측이 아니다
Unknowns이름 붙여진, 분류 가능한 결손 — "리스크가 있을 수 있음" 같은 모호함이 아니다
Assumptions하중을 지탱하는 신념, 반증 가능하도록 명시
Disconfirmation이 계획이 틀렸음을 증명할 관찰 가능한 사건 — 행동 전에 사전 약속

유효성은 구조적으로 검증된다. 최소 콘텐츠 길이, 게으른 플레이스홀더 금지 (none, n/a, tbd, 해당 없음), 우회 명령어 패턴 스캔. 표면이 없거나 공허하면 작업은 exit 2로 거부된다.

특히 Disconfirmation 필드는 단순한 "위험 목록"이 아니다. 이 계획이 틀렸음을 증명할 구체적이고 관찰 가능한 사건을 행동 전에 사전 약속하도록 강제한다. 과학철학의 핵심 원칙인 Robust Falsifiability (강건한 반증 가능성) 을 파일 시스템 수준에서 기계적으로 집행한다 — Strict Mode는 "if issues arise" 같은 조건부 공허 문구를 탐지해 거부하고, "p95 latency > 500ms for 5 min, Grafana dashboard api-latency" 같은 관찰 가능 조건만 통과시킨다. 반증될 수 없는 계획은 에픽스테메가 아니라 독사(doxa)다.

이것이 프롬프트 리마인더와 컴파일러의 차이다: 하나는 부탁하고, 하나는 진행을 거부한다.


ABCD — 네 개의 Cognitive Blueprints

모든 고위험 작업이 같은 종류의 검증을 필요로 하는 건 아니다. episteme는 네 개의 Cognitive Blueprints를 가지고 있고, 각각은 특정 실패 유형에 대응한다:

각 Blueprint가 발화할 때마다, 그리고 그것이 검증한 모든 결정은 변조 불가능한 해시 체인(tamper-evident hash chain)에 커밋된다. 그 체인은 단순한 로그가 아니다. 커널이 나중에 Active Guidance를 제공하는 방식이다: 다음 매칭 결정 시점에, 관련된 합성 프로토콜이 에이전트가 훈련 분포로 되돌아가기 전에 선제적으로 표면화된다.

결과는 축적되는 프로젝트-맞춤 Thinking Framework다. 에이전트는 갈등을 해결할 때마다 당신의 코드베이스에 대해 더 예리해진다 — 당신이 훈련시켜서가 아니라, 체인이 기억했기 때문에.


프로토콜 합성 — 커널이 시간을 건너 당신을 돕는 방식

episteme가 단순한 차단기에 그치지 않는 지점이 여기다. 해결된 모든 갈등은 재사용 가능한 프로토콜로 추출된다:

  1. 갈등 감지. 에이전트가 완전히 해결되지 않은 맥락에 대해 유효해 보이지만 양립 불가능한 두 접근을 만난다.
  2. 평균 내지 말고, 분해하라. Thinking Framework는 평균 답을 거부한다. 출처가 충돌하는지, 맥락의 어떤 특징이 저울을 기울이는지 추출하도록 강제한다.
  3. Context-fit 프로토콜 합성. 해결된 "맥락 X에서는 Y를 하라" 규칙이 append-only, 해시 체인으로 연결된 지식 저장소에 커밋된다. 변조 불가능이므로 에이전트는 배운 교훈을 몰래 다시 쓸 수 없다.
  4. 능동적으로 가이드하라. 다음 매칭 결정에서 — 몇 주 뒤든, 세션이나 도구를 건너서든 — 커널은 프로토콜을 선제적으로 표면화한다. 당신이 기억해서 물어볼 필요가 없다.
  5. 자기 유지보수하라. 에이전트가 드리프트(낡은 설정, 폐기된 API, 핵심 로직 불일치)를 발견하면, patch vs. refactor의 정직한 평가를 강제하고, 이동하기 전에 전체 파급 반경을 동기화하도록 요구한다.

지식 저장소는 메모리인 척하는 벡터 스토어가 아니다. 구조적이고, 사람이 읽을 수 있으며, 버전 관리되는 아티팩트 — 당신이 읽고, 편집하고, 포크하고, 어댑터(Claude Code, Cursor, Hermes, 미래의 도구) 사이에서 마이그레이션할 수 있다.

합성된 프로토콜들은 단순한 캐시 항목이 아니라 Knowledge Sanctuaries (지식의 성소) 다 — 당신의 코드베이스가 시간을 건너 자신에게 전달하는 국지적 진리의 보존소. 변조 불가능하고(Pillar 2 해시 체인), 교리화되지 않으며(맥락-서명과 묶여 있어 오직 매칭 컨텍스트에서만 재활성화), 새로운 증거가 들어오면 진화한다(오래된 프로토콜은 supersedes 관계로 갱신되지, 덮어쓰여지지 않는다). 성소라고 부르는 이유: 이 지식은 무분별한 LLM 평균값으로부터 보호되어야 하며, 현재 이 프로젝트에서 실제로 작동한다고 입증된 규칙만 이 공간에 머문다.

커널은 도구보다 오래 산다.


Cognitive Arms — v1.1+

위의 네 Blueprint와 세 Pillar — Cognitive Blueprints · Append-Only Hash Chain · Framework Synthesis & Active Guidance — 는 v1.0의 변하지 않는 구조적 기반이다. Pillar는 움직이지 않는다. v1.1은 그 위에서 동작하는 3 Cognitive Arms를 더한다 — 시간이 흐르면서 커널 자신의 지식을 재구성하는 유체적·능동적 엔진들이다.

이 구분은 하중을 지탱한다 — Pillar는 정착된 어휘이고, Arm은 시스템이 자기 출력을 시간을 건너 감사하고 다듬는 방식이다. 상태: v1.4.0-rc1이 2026-05-23에 cut되었고, 1170 테스트 + 54 subtests 통과. Arm A 기반(supersede-with-history 인프라 + operator profile / policy 편집을 chain stream에 자동 기록하는 hook)이 출하되었으며, Arm A 잔여 작업은 기회주의적으로 재개된다. Arm B의 substrate-facing 형태는 Event 129에서 공식 SUNSET — 그 전제(안정적 모델 능력 격차)는 Event 119–120 saturation finding에 의해 반증되었다. Operator-facing 잔여물(core/ptsp/ typed Fact/Inference 승급 게이트)은 episteme practice trace로 도달 가능한 상태로 보존된다. Arm C는 substrate-gap 주장이 살아남는다는 증거를 기다리며 미래 사이클로 스코프되었다.


빠른 시작

옵션 A — Claude Code 플러그인 마켓플레이스로 설치

Claude Code 안에서:

/plugin marketplace add junjslee/episteme
/plugin install episteme@episteme

그 후 아무 셸에서나:

episteme init     # 개인 메모리 파일 시드
episteme setup    # 작업 스타일 + 인지 프로파일 점수화
episteme sync     # Claude Code와 Hermes로 전파
episteme doctor   # 연결 확인

옵션 B — 커널을 직접 클론

git clone https://github.com/junjslee/episteme ~/episteme
cd ~/episteme
pip install -e .

episteme init
episteme setup . --write
episteme sync
episteme doctor

심화 온보딩: docs/SETUP.md. 전체 명령: docs/COMMANDS.md.


제로 트러스트 실행

OWASP Top 10 for Agentic Applications (2026) — 100명 이상의 업계 전문가가 동료 검토한 자율 에이전트의 주요 위험 분류 — 는 prompt injection, goal hijacking, overreach, memory poisoning, unbounded action을 핵심 위험 클래스로 식별한다. Knowns / Unknowns / Assumptions / Disconfirmation 구조는 각각에 대한 구조적 반박이다:

OWASP Agentic Risk (2026)episteme의 반박
직접 목표 조작 / prompt injection실행 전 Core Question 선언; 이탈은 Unknowns로 표면화
간접 명령 주입Knowns / Disconfirmation이 신뢰 가능한 상태와 prompt 내용을 분리; 검색된 입력에 따라 행동하기 전 falsifiable한 결과에 commit
Overreach / unbounded actionFrame에서 제약 체제 선언; reversible-first 정책 강제
유창한 환각Unknowns 필드는 비워둘 수 없음; 행동 전 가정은 명명되어야 함
메모리 오염Pillar 2 hash-chained protocols — append-only, tamper-evident; 사전 상태의 침묵 재작성은 verify_chain이 감지
무한 계획 루프Disconfirmation 조건 필수; 증거 발화 시 루프 종료

명명되지 않은 가정은 신뢰되지 않는다. 전제조건(Knowns)과 제약 체제가 선언되지 않은 한 어떤 행동도 취해지지 않는다. 커널은 의도와 실행 사이의 검증 레이어다.

업계 수렴 — 2025–2026

같은 시기의 주요 프레임워크와 학술 논문이 커널이 출하한 동일한 아키텍처 패턴으로 수렴하고 있다: 파일 시스템 수준의 사전 호출 체크포인트 (Capsule Security ClawGuard, 2026), hash-chained tamper-evident memory (SSGM — Lam et al., 2026), 규칙 목록 대신 이유 기반 정렬 (Anthropic Claude Constitution, 2026-01-22), 거버넌스 레이어를 갖춘 5단계 인지 루프 (SCL R-CCAM — Kim, 2025), 5-pillar agent integrity (Proofpoint Agent Integrity Framework 2026). 커널은 이러한 출판물보다 앞선다 (CP1 2026-04-21 출하; v1.0.0 GA 2026-04-28); 수렴은 독립적 검증이지 계보가 아니다. 전체 attribution map은 kernel/REFERENCES.md Convergent contemporary work 섹션 참조.


이 아키텍처가 해결하는 실패 모드

kernel/FAILURE_MODES.md는 11가지 명명된 실패 모드를 정의한다 — Kahneman의 6가지 추론 모드(WYSIATI, question substitution, anchoring, narrative fallacy, planning fallacy, overconfidence)에 3가지 거버넌스 모드(Chesterton's fence, Goodhart drift, Ashby variety mismatch)와 v1.0 RC의 2가지 추가 모드(framework-as-Doxa, cascade-theater)를 더한 것이다.

각 모드는 구체적 반박 아티팩트에 매핑된다:

실패 모드반박 아티팩트
WYSIATI (맥락에 있는 것만으로 추론)Reasoning Surface의 Unknowns 필드
Question substitution (쉬운 질문으로 치환)Frame 단계의 Core Question 요구
Anchoring (첫 프레이밍 고착)Disconfirmation 필드
Chesterton's fence (제약을 이해 없이 제거)Blueprint B Fence Reconstruction
Cascade-theater (파급 동기화 연기)Blueprint D + Layer 3 entity grounding

반박이 제거되거나 우회될 때는 어떤 모드가 이제 보호받지 못하는지 명명되어야 한다. 답이 "없음"이라면 그 반박은 자리값을 하고 있지 않았던 것이다.

자세히: kernel/FAILURE_MODES.md.


철학 — doxa · episteme · praxis · 결

저장소 이름은 그리스어에서 왔다:

한국어 (gyeol)은 나무나 돌의 결 — 따를 때 일관된 형태를 낳고, 거슬러 자를 때 균열하는 — 잠재적 패턴-구조다. Reasoning Surface의 필드 순서 (Knowns → Unknowns → Assumptions → Disconfirmation)가 바로 인식론적 규율의 결이다: 정착된 → 열려있는 → 잠정적 → 반증 조건.


더 읽기

주제위치
커널 30줄 증류kernel/SUMMARY.md
v1.0 RC 설계 방향docs/DESIGN_V1_0_SEMANTIC_GOVERNANCE.md
커널이 산출하는 4-아티팩트 예시demos/01_attribution-audit/
Thinking Framework OFF vs. ON 비교demos/03_differential/
Hook 레퍼런스 + governance packsdocs/HOOKS.md
커널이 틀린 도구일 때kernel/KERNEL_LIMITS.md
차용한 모든 개념의 1차 출처kernel/REFERENCES.md
에이전트 저장소 운영 계약AGENTS.md

episteme인가 — 한 문장으로

프롬프트가 아니라 자세(Posture over prompt). 더 좋은 문구를 찾는 대신, AI 에이전트가 생각하는 방식의 틀을 파일 시스템 수준에 세운다. 컴파일러처럼 거부할 수 있는 Thinking Framework. 당신의 에이전트를 더 똑똑하게 만드는 것이 아니라, 그 똑똑함이 당신의 맥락에 착지하게 만든다.

Built as a Sovereign Cognitive Kernel — 생각의 틀.