Das System, das entscheidet,
was deine KI sieht.
Der Context-Engineering-Layer für KI-AgentenEine lokale Binary auf beiden Seiten des Modells. LeanCTX nimmt wahr, komprimiert, erinnert, routet und kontrolliert den vollständigen Lebenszyklus von KI-Kontext — vom Datei-Read bis zum verifizierten Output.
Was ist ein Cognitive Context Layer?
Ein Cognitive Context Layer ist die Infrastruktur zwischen deinen KI-Tools und deiner Codebasis. Er steuert, welche Dateien gelesen werden, wie Output komprimiert wird, welches Wissen über Sessions hinweg bestehen bleibt und ob Ergebnisse vor der Auslieferung den Qualitätsstandards genügen.
Die Konstruktionszeichnung
Die Prozess-Topologie der ausgelieferten Binary: sieben Einstiegspunkte, eine Laufzeit, ein Satz lokaler Stores. Jede Box unten entspricht einem echten Modul, Port oder einer Datei auf der Platte.
lean-ctx lean-ctx serve lean-ctx serve --daemon lean-ctx -c "<cmd>" lean-ctx proxy start lean-ctx dashboard lean-ctx watch · gain --live Was mit einem einzelnen Read passiert
Blatt 2 verfolgt eine Anfrage Stufe für Stufe durch die Laufzeit, inklusive des Cache-Kurzschlusses, der wiederholte Reads nahezu kostenlos macht. Der Shell-Pfad läuft parallel mit derselben Abrechnung.
ctx_read(path, mode) · lean-ctx read - PathJail
core/pathjail.rsKanonisiert den Pfad und weist Escapes außerhalb des Workspace-Roots ab, bevor irgendein I/O passiert.
- Session-Cache
hit → ~13 tokensContent-adressiertes Lookup mit Schlüssel aus Pfad + mtime/Hash. Unveränderte Dateien kollabieren zu einem Stub, statt Inhalt erneut zu senden.
- AST-Extraktion
26 languagestree-sitter parst die Datei in einen Syntaxbaum: Signaturen, Imports, Call-Edges — auch Lua, Luau, Kotlin und GDScript werden graph-indiziert. Regex-Fallback für nicht unterstützte Sprachen.
- Modus-Auswahl
10 modesauto wählt den optimalen von 10 Read-Modi (full, map, signatures, diff, task, reference, aggressive, entropy, lines:N-M) aus Task-Intent und Dateigröße; structure_first lenkt kalte Code-Reads mittlerer Größe Richtung map, und eine bei einem Fix-Task als verdächtig markierte Datei wird auf full gezwungen.
- Kompression
adaptive thresholdsShannon-Entropie-Zeilenfilterung, U-Kurven-Attention-Platzierung (LITM), TF-IDF-Codebook und query-konditionierte Information-Bottleneck-Fusion — ein Anti-Inflation-Guard liefert die Datei wortgetreu, wann immer das Framing mehr Tokens kosten würde als die rohen Bytes.
- Token-Abrechnung
core/tokens.rsExakte tiktoken-Zählung (o200k_base; cl100k_base-Näherung für Modelle der Claude-Familie) auf Input und Output.
- Ledger + Stats
savings sign / verify-batchEinsparungen werden an das lokale Ledger angehängt (Ed25519-signierbar), Stats und der gain-Score aktualisieren sich, das Ergebnis streamt zurück.
lean-ctx -c "cargo test" · IDE bash hook Beide Pfade enden im selben Ledger: jedes Kompressions-Event wird mit exakter Tokenizer-Mathematik gezählt und speist gain, das Dashboard und das signierte Savings-Ledger.
Technisches Datenblatt
Die Referenztabellen hinter den Zeichnungen: jede Oberfläche mit Transport und Lebenszyklus, das On-Disk-Layout, die adaptiven Lernschichten und die Sicherheitsgrenzen, die die Laufzeit durchsetzt.
AProzessmodell
Alle Oberflächen sind dieselbe Binary in verschiedenen Rollen. Nichts braucht eine Cloud-Verbindung; alles bindet local-first.
| REF | SURFACE | TRANSPORT | ENDPOINT | LIFECYCLE | BEFEHL |
|---|---|---|---|---|---|
| 01 | MCP-Server (stdio) | JSON-RPC über stdin/stdout | pro Editor-Session gestartet | Kindprozess des Editors | lean-ctx |
| 02 | MCP-Server (HTTP) | MCP Streamable HTTP | localhost, konfigurierbar via --host/--port | Vordergrund oder Service | lean-ctx serve |
| 03 | IPC-Daemon | Unix Domain Socket | OS-Data-Dir, z. B. ~/Library/Application Support/lean-ctx/daemon.sock | launchd / systemd Autostart | lean-ctx serve --daemon |
| 04 | Shell-Hook | Prozess-Exec, komprimierter stdout | umschließt IDE-Bash-Aufrufe + interaktive Shells | pro Befehl | lean-ctx -c "<cmd>" |
| 05 | API-Proxy | HTTP (LLM-API-Pass-through) | localhost:4444 (Standard) | bei Bedarf | lean-ctx proxy start |
| 06 | Web-Dashboard | HTTP + Bearer-Token | localhost:3333 (Standard, --port) | bei Bedarf | lean-ctx dashboard |
| 07 | Terminal-UI | TTY (In-place-Redraw) | Live-Event-Stream / 1 s Refresh | interaktiv | lean-ctx watch · gain --live |
BStorage-Layout — lokale XDG-Verzeichnisse
Persistenter Zustand sind einfache Dateien unter den XDG-Basisverzeichnissen: inspizierbar, exportierbar, löschbar. Keine versteckten Datenbanken außerhalb dieser lokalen Ordner.
| ARTEFAKT | FORM | ZWECK |
|---|---|---|
config.toml | TOML | Einzelne Config-Datei — Integrationsmodus, Kompression, Provider, Opt-outs (Config-Dir) |
cache/ | content-adressiert | Session-Datei-Cache; unveränderte Re-Reads kollabieren zu ~13-Token-Stubs (Cache-Dir) |
bm25 index | invertierter Index | Lexikalische Suche über Code-Chunks + Provider-Dokumente (Data-Dir) |
context_graph/ | Property-Graph | Imports, Calls, Typen über Dateien und Repos — treibt map-Modus + Deep-Queries (Data-Dir) |
knowledge | SQLite | Persistente Fakten, Entscheidungen, Rooms — über Sessions hinweg abrufbar, CCP (Data-Dir) |
savings ledger | append-only JSONL | Jedes Kompressions-Event; Ed25519-signierbar für Audits (Data-Dir) |
litm_calibration.json | JSON | Gelernte Kontext-Positions-Trefferraten (Lost-in-the-Middle-Kalibrierung) (Cache-Dir) |
events.jsonl | Event-Stream | Live-Feed, konsumiert von watch, Dashboard und Efficacy-Reports (State-Dir) |
CAdaptive Lernschichten
Sieben Online-Learning-Mechanismen stimmen die Kompression auf deine reale Nutzung ab — lokal, aus Qualitätssignalen wie Bounces und Edit-Fehlern. Tiefer eintauchen: Adaptive Learning →
- L1 Adaptive Schwellenwerte Online-gelernte Kompressions-Aggressivität aus Qualitätssignalen (Bounces, fehlgeschlagene Edits, saubere Runs)
- L2 LITM-Kalibrierung Empirische Platzierung kritischen Kontexts an Positionen, die das Modell tatsächlich beachtet
- L3 Stigmergisches Scent-Field Multi-Agent-Koordination über zerfallende Marker: claimed, done, stuck, hot, avoid
- L4 Delta-Playbook Inkrementelle Checkpoint-Snapshots, die Kontext-Kompaktierung überleben
- L5 Query-konditioniertes IB Information-Bottleneck-Kompression, fusioniert mit Query-Relevanz
- L6 Theta-Gamma-Chunking Wakeup-Fakten gruppiert in attention-freundlichen Bursts
- L7 Semantisches Dedup Likelihood-bewertete Redundanzfilterung über die Session
DSicherheitsgrenzen
Harte Garantien, in der Laufzeit durchgesetzt. Sicherheitsmodell →
- PathJail Jeder Dateizugriff wird kanonisiert und auf den Workspace-Root beschränkt
- IDE-Config-Dir-Jail Home-Level-IDE-/Agent-Config-Dirs (~/.claude, ~/.codex, ~/.codebuddy, …) sind nur schreibbar, wenn allow_ide_config_dirs aktiviert ist; sonst blockiert PathJail sie
- Shell-Allowlist Deny-by-default-Befehls-Policy für agent-initiierte Shell-Ausführungen
- Local-first Gesamte Verarbeitung on-device; das Dashboard bindet an localhost und erfordert ein Bearer-Token
- Signierte Evidenz Savings-Ledger-Einträge sind Ed25519-signierbar und batch-verifizierbar
Eine Binary. Drei Wege hinein.
LeanCTX wählt für jeden Agenten automatisch den optimalen Integrationsmodus: CLI-Redirect treibt die LeanCTX-CLI über Editor-Regeln ohne MCP-Overhead, Hybrid kombiniert MCP-gecachte Reads mit Shell-Kompressions-Hooks, und Full MCP bietet maximalen Tool-Zugriff für Protokoll-only-Editoren.
lean-ctx -c / read / grep MCP cache + CLI shell/search 81 tools via MCP + lazy tool set So oder so wählt LeanCTX automatisch den richtigen Modus für deinen Editor. Alle 30+ unterstützten Tools ansehen
Immer an. Immer deins.
Ein kleiner Hintergrunddienst hält deine Session warm, sodass Cache-Hits sofort kommen und das Gedächtnis immer da ist. Er startet automatisch beim Setup, startet sich nach Updates selbst neu und räumt hinter sich auf — nichts zu verwalten.
Jede Fähigkeit, eine Binary.
Alles zwischen deinem Code und der KI, erledigt.
Smart I/O
Deterministische Reads, Shell-Kompression, Suche, volle Kontext-Sichtbarkeit + 99% weniger Tokens
Request-Kompression
Ein optionaler lokaler Proxy komprimiert jeden Request an das Modell — System-Prompt, History und Tool-Ergebnisse — Prompt-Cache-sicher.
Intelligence
Intent-Routing, Modus-Auswahl, adaptive Pipeline
Memory
Sessions, Projektwissen, Graphen, Handoffs
Governance
Rollen, Budgets, SLOs, Workflow-Gates, Policies
Verification
Formale Lean4-Beweise, claim-basierte Verifikation, Quality Levels 0–4
Integrations
MCP, HTTP, SDK, 29+ IDEs, Cloud, Team-Server
Shared Sessions
Workspace- & kanalbasiertes Session-Sharing über Agenten hinweg
Context Bus
Echtzeit-Event-Stream für Kontextänderungen via SSE
SDK & API
TypeScript-SDK und REST-API für externe Integrationen
Jeder Output trägt einen Beweis
LeanCTX erzeugt für jede Session Beweis-Artefakte: welche Dateien gelesen wurden, was komprimiert wurde, welche Checks bestanden und wie Tokens ausgegeben wurden. Das macht KI-Arbeit auditierbar, wiederholbar und vertrauenswürdig.
LeanCTX (kurz für Lean Context) ist der Open-Source-Context-Engineering-Layer für KI-Agenten. Eine lokale Rust-Binary entscheidet, was Agenten lesen (10 Read-Modi, 60–90 % weniger Tokens, gecachte Re-Reads mit ~13 Tokens), merkt sich, was sie lernen (persistente Sessions, Knowledge-Graph), schützt, worauf sie zugreifen (PathJail, Secret-Redaction, Budgets, Injection-Erkennung), beweist, was sie einsparen (Ed25519-signiertes Ledger, reproduzierbarer Benchmark) und spult zurück, was sie gesehen haben (git-verankerte, signierte Kontext-Snapshots zum Wiederherstellen oder Teilen); ein optionaler lokaler Proxy komprimiert, was sie senden — System-Prompt, History und Tool-Output jeder Anfrage, prompt-cache-sicher auf der Leitung. Kompression — Read- und Wire-seitig — ist eines von fünf Subsystemen, und jedes Original bleibt lokal abrufbar. Funktioniert mit 30+ KI-Coding-Tools über MCP und Shell-Hooks; lässt sich über eine versionierte /v1-API mit SDKs für Python, TypeScript und Rust in jeden Agenten einbetten. Die lokale Nutzung ist für immer kostenlos, per CI durchgesetzt.
Die ganze Geschichte lesen