Votre agent IA choisit les mauvais outils, ignore les budgets et gaspille du calcul sur des tâches triviales.
LeanCTX route chaque requête à travers un pipeline adaptatif alimenté par des graphes. Il classifie l'intention de la tâche, fusionne BM25, embeddings sémantiques et proximité de graphes via Reciprocal Rank Fusion (RRF) pour la recherche, applique les budgets de tokens et de coûts, et enrichit les vues d'ensemble avec des faits de connaissance et des hotspots du graphe. Le throttling progressif et le mode terse maintiennent l'efficacité des longues sessions.
Chaque requête reçoit le même traitement
Sans routage intelligent, chaque requête reçoit le même traitement générique. Un simple renommage reçoit le même contexte lourd qu'un refactoring complexe.
ctx_intent classifie votre tâche et sélectionne automatiquement le mode de lecture, le budget et la stratégie de pipeline optimaux.
11 outils
Routage d'intentions
La classification automatique des tâches route les requêtes vers le mode de traitement optimal.
Sélection de mode
Un prédicteur de mode appris sélectionne la meilleure stratégie de compression selon le type de tâche et le contexte.
Application des budgets
Budgets de tokens, coûts et temps avec actions SLO : avertir, limiter ou bloquer.
Pipeline adaptatif
Six étapes de pipeline avec basculements par profil et métriques en temps réel.
Fusion de Recherche Hybride
Combine la correspondance de mots-clés BM25, les embeddings sémantiques et les scores de proximité du graphe via Reciprocal Rank Fusion (RRF).
Overview enrichi de connaissances
ctx_overview affiche les faits de connaissance pertinents et les hotspots du Property Graph aux côtés du résumé d'architecture.
Throttling progressif de recherche
Des indices échelonnés guident l'agent lorsque les recherches répétées retournent des résultats décroissants, réduisant les tokens gaspillés.
Mode Terse
Mode de réponse concise configurable qui supprime les explications verbeuses, idéal pour les développeurs expérimentés et les longues sessions.
Potentiel de contexte (Φ)
Chaque élément de contexte est évalué par une fonction potentielle à six facteurs combinant pertinence, structure, récence, historique, coût et redondance.
Compilateur de contexte
La sélection gloutonne classée par Φ construit des paquets de contexte minimaux dans tout budget de tokens, avec élimination automatique de la redondance.
Handles de contexte
Références différées et légères (@F1, @K3) qui reportent le chargement du contenu jusqu'au besoin — pointeurs de contexte à coût zéro pour l'efficacité en tokens.
Protocole d'Efficacité Cognitive (CEP)
Un protocole structuré pour maximiser la qualité du raisonnement IA grâce à une livraison de contexte optimisée.
10 MCP outils
LeanCTX route chaque requête à travers un pipeline adaptatif alimenté par des graphes. Il classifie l'intention de la tâche, fusionne BM25, embeddings sémantiques et proximité de graphes via Reciprocal Rank Fusion (RRF) pour la recherche, applique les budgets de tokens et de coûts, et enrichit les vues d'ensemble avec des faits de connaissance et des hotspots du graphe. Le throttling progressif et le mode terse maintiennent l'efficacité des longues sessions.
ctx_intent Structured intent input (optional) — submit compact JSON or short text; server also infers intents automatically from tool calls.
ctx_overview Task-relevant project map — use at session start.
ctx_preload Proactive context loader — caches task-relevant files, returns L-curve-optimized summary (~50-100 tokens vs ~5000 for individual reads).
ctx_prefetch Predictive prefetch — prewarm cache for blast radius files (graph + task signals) within budgets.
ctx_dedup Cross-file dedup: analyze or apply shared block references.
ctx_response Compress LLM response text (remove filler, apply TDD).
ctx_benchmark Benchmark compression modes for a file or project.
ctx_context Session context overview — cached files, seen files, session state.
ctx_routes List HTTP routes/endpoints extracted from the project. Supports Express, Flask, FastAPI, Actix, Spring, Rails, Next.js.
ctx_feedback Harness feedback for LLM output tokens/latency (local-first). Actions: record|report|json|reset|status.
Chaque sortie porte une preuve
LeanCTX génère des artefacts de preuve pour chaque session : quels fichiers ont été lus, ce qui a été compressé, quelles vérifications ont réussi et comment les tokens ont été dépensés. Cela rend le travail IA auditable, reproductible et fiable.
Explorer les outils d'intelligence
LeanCTX route chaque requête à travers un pipeline adaptatif alimenté par des graphes. Il classifie l'intention de la tâche, fusionne BM25, embeddings sémantiques et proximité de graphes via Reciprocal Rank Fusion (RRF) pour la recherche, applique les budgets de tokens et de coûts, et enrichit les vues d'ensemble avec des faits de connaissance et des hotspots du graphe. Le throttling progressif et le mode terse maintiennent l'efficacité des longues sessions.