Cognitive Context Layer

Das System, das entscheidet,
was deine KI sieht.

Der Context-Engineering-Layer für KI-AgentenEine lokale Binary auf beiden Seiten des Modells. LeanCTX nimmt wahr, komprimiert, erinnert, routet und kontrolliert den vollständigen Lebenszyklus von KI-Kontext — vom Datei-Read bis zum verifizierten Output.

Loslegen Benchmark

Cognitive Context Layer

Was ist ein Cognitive Context Layer?

Ein Cognitive Context Layer ist die Infrastruktur zwischen deinen KI-Tools und deiner Codebasis. Er steuert, welche Dateien gelesen werden, wie Output komprimiert wird, welches Wissen über Sessions hinweg bestehen bleibt und ob Ergebnisse vor der Auslieferung den Qualitätsstandards genügen.

KI-Agent

LeanCTX Cognitive Context Layer

I/O Intelligence Memory Verify

Dein Code & deine Tools

System-Blueprint

Die Konstruktionszeichnung

Die Prozess-Topologie der ausgelieferten Binary: sieben Einstiegspunkte, eine Laufzeit, ein Satz lokaler Stores. Jede Box unten entspricht einem echten Modul, Port oder einer Datei auf der Platte.

AGENT-CLIENTS

CursorClaude CodeCopilotWindsurfCodexGemini CLI30+ Agents

SURFACES — EINSTIEGSPUNKTE

01 MCP-Server (stdio) lean-ctx

02 MCP-Server (HTTP) lean-ctx serve

03 IPC-Daemon lean-ctx serve --daemon

04 Shell-Hook lean-ctx -c "<cmd>"

05 API-Proxy lean-ctx proxy start

06 Web-Dashboard lean-ctx dashboard

07 Terminal-UI lean-ctx watch · gain --live

CORE RUNTIME — EINZELNE RUST-BINARY

Tool-Dispatch 81 MCP-Tools · Lazy-Tool-Set (5 vereinheitlicht)

Pattern-Engine 95+ Shell-Patterns · git, cargo, npm, docker, kubectl, …

Read-Pipeline 10 Read-Modi · Auto-Auswahl pro Request

AST-Schicht tree-sitter · 26 Sprachen · Regex-Fallback

Kompression Entropie · Attention-U-Kurve · TF-IDF · Query-IB

Adaptives Lernen 7 Online-Learning-Schichten · Efficacy-Reporting

LOKALE STORES — XDG-VERZEICHNISSE

Session-CacheBM25-IndexProperty-GraphKnowledge (SQLite)Savings-Ledger (Ed25519)config.toml

EXTERNE PROVIDER

GitHubGitLabJira (+ OAuth)PostgresMCP-BridgeConfig-REST (Linear, …)

BM25-ChunksGraph-EdgesKnowledge-FactsCache-Einträge

Eine Binary, sieben Einstiegspunkte. Surfaces teilen sich dieselbe Runtime und dieselben lokalen Stores — Provider-Daten werden in dieselben Indizes konsolidiert, die auch File-Reads nutzen.

Datenfluss

Was mit einem einzelnen Read passiert

Blatt 2 verfolgt eine Anfrage Stufe für Stufe durch die Laufzeit, inklusive des Cache-Kurzschlusses, der wiederholte Reads nahezu kostenlos macht. Der Shell-Pfad läuft parallel mit derselben Abrechnung.

READ-PFAD ctx_read(path, mode) · lean-ctx read

PathJail core/pathjail.rs

Kanonisiert den Pfad und weist Escapes außerhalb des Workspace-Roots ab, bevor irgendein I/O passiert.
Session-Cache hit → ~13 tokens

Content-adressiertes Lookup mit Schlüssel aus Pfad + mtime/Hash. Unveränderte Dateien kollabieren zu einem Stub, statt Inhalt erneut zu senden.
AST-Extraktion 26 languages

tree-sitter parst die Datei in einen Syntaxbaum: Signaturen, Imports, Call-Edges — auch Lua, Luau, Kotlin und GDScript werden graph-indiziert. Regex-Fallback für nicht unterstützte Sprachen.
Modus-Auswahl 10 modes

auto wählt den optimalen von 10 Read-Modi (full, map, signatures, diff, task, reference, aggressive, entropy, lines:N-M) aus Task-Intent und Dateigröße; structure_first lenkt kalte Code-Reads mittlerer Größe Richtung map, und eine bei einem Fix-Task als verdächtig markierte Datei wird auf full gezwungen.
Kompression adaptive thresholds

Shannon-Entropie-Zeilenfilterung, U-Kurven-Attention-Platzierung (LITM), TF-IDF-Codebook und query-konditionierte Information-Bottleneck-Fusion — ein Anti-Inflation-Guard liefert die Datei wortgetreu, wann immer das Framing mehr Tokens kosten würde als die rohen Bytes.
Token-Abrechnung core/tokens.rs

Exakte tiktoken-Zählung (o200k_base; cl100k_base-Näherung für Modelle der Claude-Familie) auf Input und Output.
Ledger + Stats savings sign / verify-batch

Einsparungen werden an das lokale Ledger angehängt (Ed25519-signierbar), Stats und der gain-Score aktualisieren sich, das Ergebnis streamt zurück.

SHELL-PFAD lean-ctx -c "cargo test" · IDE bash hook

H1 Allowlist Deny-by-default-Policy

H2 Ausführen echter Befehl, echter Exit-Code

H3 Pattern-Engine 95+ handgefertigte Patterns

H4 Komprimierter stdout Fehler überleben immer

Beide Pfade enden im selben Ledger: jedes Kompressions-Event wird mit exakter Tokenizer-Mathematik gezählt und speist gain, das Dashboard und das signierte Savings-Ledger.

Spezifikationen

Technisches Datenblatt

Die Referenztabellen hinter den Zeichnungen: jede Oberfläche mit Transport und Lebenszyklus, das On-Disk-Layout, die adaptiven Lernschichten und die Sicherheitsgrenzen, die die Laufzeit durchsetzt.

AProzessmodell

Alle Oberflächen sind dieselbe Binary in verschiedenen Rollen. Nichts braucht eine Cloud-Verbindung; alles bindet local-first.

REF	SURFACE	TRANSPORT	ENDPOINT	LIFECYCLE	BEFEHL
01	MCP-Server (stdio)	JSON-RPC über stdin/stdout	pro Editor-Session gestartet	Kindprozess des Editors	`lean-ctx`
02	MCP-Server (HTTP)	MCP Streamable HTTP	localhost, konfigurierbar via --host/--port	Vordergrund oder Service	`lean-ctx serve`
03	IPC-Daemon	Unix Domain Socket	OS-Data-Dir, z. B. ~/Library/Application Support/lean-ctx/daemon.sock	launchd / systemd Autostart	`lean-ctx serve --daemon`
04	Shell-Hook	Prozess-Exec, komprimierter stdout	umschließt IDE-Bash-Aufrufe + interaktive Shells	pro Befehl	`lean-ctx -c "<cmd>"`
05	API-Proxy	HTTP (LLM-API-Pass-through)	localhost:4444 (Standard)	bei Bedarf	`lean-ctx proxy start`
06	Web-Dashboard	HTTP + Bearer-Token	localhost:3333 (Standard, --port)	bei Bedarf	`lean-ctx dashboard`
07	Terminal-UI	TTY (In-place-Redraw)	Live-Event-Stream / 1 s Refresh	interaktiv	`lean-ctx watch · gain --live`

BStorage-Layout — lokale XDG-Verzeichnisse

Persistenter Zustand sind einfache Dateien unter den XDG-Basisverzeichnissen: inspizierbar, exportierbar, löschbar. Keine versteckten Datenbanken außerhalb dieser lokalen Ordner.

ARTEFAKT	FORM	ZWECK
`config.toml`	TOML	Einzelne Config-Datei — Integrationsmodus, Kompression, Provider, Opt-outs (Config-Dir)
`cache/`	content-adressiert	Session-Datei-Cache; unveränderte Re-Reads kollabieren zu ~13-Token-Stubs (Cache-Dir)
`bm25 index`	invertierter Index	Lexikalische Suche über Code-Chunks + Provider-Dokumente (Data-Dir)
`context_graph/`	Property-Graph	Imports, Calls, Typen über Dateien und Repos — treibt map-Modus + Deep-Queries (Data-Dir)
`knowledge`	SQLite	Persistente Fakten, Entscheidungen, Rooms — über Sessions hinweg abrufbar, CCP (Data-Dir)
`savings ledger`	append-only JSONL	Jedes Kompressions-Event; Ed25519-signierbar für Audits (Data-Dir)
`litm_calibration.json`	JSON	Gelernte Kontext-Positions-Trefferraten (Lost-in-the-Middle-Kalibrierung) (Cache-Dir)
`events.jsonl`	Event-Stream	Live-Feed, konsumiert von watch, Dashboard und Efficacy-Reports (State-Dir)

CAdaptive Lernschichten

Sieben Online-Learning-Mechanismen stimmen die Kompression auf deine reale Nutzung ab — lokal, aus Qualitätssignalen wie Bounces und Edit-Fehlern. Tiefer eintauchen: Adaptive Learning →

L1
Adaptive Schwellenwerte Online-gelernte Kompressions-Aggressivität aus Qualitätssignalen (Bounces, fehlgeschlagene Edits, saubere Runs)
L2
LITM-Kalibrierung Empirische Platzierung kritischen Kontexts an Positionen, die das Modell tatsächlich beachtet
L3
Stigmergisches Scent-Field Multi-Agent-Koordination über zerfallende Marker: claimed, done, stuck, hot, avoid
L4
Delta-Playbook Inkrementelle Checkpoint-Snapshots, die Kontext-Kompaktierung überleben
L5
Query-konditioniertes IB Information-Bottleneck-Kompression, fusioniert mit Query-Relevanz
L6
Theta-Gamma-Chunking Wakeup-Fakten gruppiert in attention-freundlichen Bursts
L7
Semantisches Dedup Likelihood-bewertete Redundanzfilterung über die Session

DSicherheitsgrenzen

Harte Garantien, in der Laufzeit durchgesetzt. Sicherheitsmodell →

PathJail Jeder Dateizugriff wird kanonisiert und auf den Workspace-Root beschränkt
IDE-Config-Dir-Jail Home-Level-IDE-/Agent-Config-Dirs (~/.claude, ~/.codex, ~/.codebuddy, …) sind nur schreibbar, wenn allow_ide_config_dirs aktiviert ist; sonst blockiert PathJail sie
Shell-Allowlist Deny-by-default-Befehls-Policy für agent-initiierte Shell-Ausführungen
Local-first Gesamte Verarbeitung on-device; das Dashboard bindet an localhost und erfordert ein Bearer-Token
Signierte Evidenz Savings-Ledger-Einträge sind Ed25519-signierbar und batch-verifizierbar

Integrationsmodi

Eine Binary. Drei Wege hinein.

LeanCTX wählt für jeden Agenten automatisch den optimalen Integrationsmodus: CLI-Redirect treibt die LeanCTX-CLI über Editor-Regeln ohne MCP-Overhead, Hybrid kombiniert MCP-gecachte Reads mit Shell-Kompressions-Hooks, und Full MCP bietet maximalen Tool-Zugriff für Protokoll-only-Editoren.

CLI-Redirect

Für regelgesteuerte und Terminal-first-Agenten, plus CI

Editor-Regeln leiten jeden Read, jede Suche und jeden Shell-Call über die CLI. Kein MCP-Server, kein Schema-Overhead.

lean-ctx -c / read / grep

Hybrid

Standard für Cursor, Claude Code, Codex, Windsurf und 20+ Agenten

MCP für gecachte Reads (13 Tokens), CLI für Shell-Befehle und Suchen — das Beste aus beiden Welten.

MCP cache + CLI shell/search

Full MCP

Für JetBrains, VS Code, Neovim, Emacs, Zed

Alle 81 Tools über das MCP-Protokoll mit Lazy-Tool-Set — ideal für Agenten, die MCP voraussetzen.

81 tools via MCP + lazy tool set

So oder so wählt LeanCTX automatisch den richtigen Modus für deinen Editor. Alle 30+ unterstützten Tools ansehen

Hintergrund-Daemon

Immer an. Immer deins.

Ein kleiner Hintergrunddienst hält deine Session warm, sodass Cache-Hits sofort kommen und das Gedächtnis immer da ist. Er startet automatisch beim Setup, startet sich nach Updates selbst neu und räumt hinter sich auf — nichts zu verwalten.

lean-ctx serve --status

$ lean-ctx serve --status

Daemon running (PID 4139)

Endpoint: ~/Library/Application Support/lean-ctx/daemon.sock (ready)

PID file: ~/Library/Application Support/lean-ctx/daemon.pid

# autostart on login:

$ lean-ctx daemon enable # launchd / systemd

Fähigkeiten

Jede Fähigkeit, eine Binary.

Alles zwischen deinem Code und der KI, erledigt.

Smart I/O

Deterministische Reads, Shell-Kompression, Suche, volle Kontext-Sichtbarkeit + 99% weniger Tokens

14 Tools 6 Features

Request-Kompression

Ein optionaler lokaler Proxy komprimiert jeden Request an das Modell — System-Prompt, History und Tool-Ergebnisse — Prompt-Cache-sicher.

4 Tools 5 Features

Intelligence

Intent-Routing, Modus-Auswahl, adaptive Pipeline

13 Tools 11 Features

Memory

Sessions, Projektwissen, Graphen, Handoffs

12 Tools 5 Features

Governance

Rollen, Budgets, SLOs, Workflow-Gates, Policies

6 Tools 9 Features

Verification

Formale Lean4-Beweise, claim-basierte Verifikation, Quality Levels 0–4

7 Tools 8 Features

Integrations

MCP, HTTP, SDK, 29+ IDEs, Cloud, Team-Server

6 Tools 6 Features

Shared Sessions

Workspace- & kanalbasiertes Session-Sharing über Agenten hinweg

4 Tools 5 Features

Context Bus

Echtzeit-Event-Stream für Kontextänderungen via SSE

2 Tools 5 Features

SDK & API

TypeScript-SDK und REST-API für externe Integrationen

0 Tools 4 Features

Verifikation

Jeder Output trägt einen Beweis

LeanCTX erzeugt für jede Session Beweis-Artefakte: welche Dateien gelesen wurden, was komprimiert wurde, welche Checks bestanden und wie Tokens ausgegeben wurden. Das macht KI-Arbeit auditierbar, wiederholbar und vertrauenswürdig.

Cookbook & SDK

Real examples against a running server (<code>/v1/tools/call</code>).

Verification & CI

Guardrails: clippy/tests + output verification.

Memory (Policies)

Feedback, relations, retrieval modes.

Trust

What LeanCTX does, stores, and never does.

Die Definition in einem Absatz

LeanCTX (kurz für Lean Context) ist der Open-Source-Context-Engineering-Layer für KI-Agenten. Eine lokale Rust-Binary entscheidet, was Agenten lesen (10 Read-Modi, 60–90 % weniger Tokens, gecachte Re-Reads mit ~13 Tokens), merkt sich, was sie lernen (persistente Sessions, Knowledge-Graph), schützt, worauf sie zugreifen (PathJail, Secret-Redaction, Budgets, Injection-Erkennung), beweist, was sie einsparen (Ed25519-signiertes Ledger, reproduzierbarer Benchmark) und spult zurück, was sie gesehen haben (git-verankerte, signierte Kontext-Snapshots zum Wiederherstellen oder Teilen); ein optionaler lokaler Proxy komprimiert, was sie senden — System-Prompt, History und Tool-Output jeder Anfrage, prompt-cache-sicher auf der Leitung. Kompression — Read- und Wire-seitig — ist eines von fünf Subsystemen, und jedes Original bleibt lokal abrufbar. Funktioniert mit 30+ KI-Coding-Tools über MCP und Shell-Hooks; lässt sich über eine versionierte /v1-API mit SDKs für Python, TypeScript und Rust in jeden Agenten einbetten. Die lokale Nutzung ist für immer kostenlos, per CI durchgesetzt.

Die ganze Geschichte lesen

Hol dir die Kontrolle über deinen Kontext zurück.

Eine lokale Binary auf beiden Seiten des Modells. LeanCTX nimmt wahr, komprimiert, erinnert, routet und kontrolliert den vollständigen Lebenszyklus von KI-Kontext — vom Datei-Read bis zum verifizierten Output.

Loslegen GitHub

Das System, das entscheidet,was deine KI sieht.