AI Context Intelligence — Intent Routing & Smart Search

Le problème

Chaque requête reçoit le même traitement

Sans routage intelligent, chaque requête reçoit le même traitement générique. Un simple renommage reçoit le même contexte lourd qu'un refactoring complexe.

ctx_intent classifie votre tâche et sélectionne automatiquement le mode de lecture, le budget et la stratégie de pipeline optimaux.

ctx_intent

ctx_intent ({ task: "rename getUserById to findUserById" })

- intent: refactor/rename

- mode: signatures

- budget: 8,000 tokens

- profile: coder

Intelligence

11 outils

01

Routage d'intentions

La classification automatique des tâches route les requêtes vers le mode de traitement optimal.

02

Sélection de mode

Un prédicteur de mode appris sélectionne la meilleure stratégie de compression selon le type de tâche et le contexte.

03

Application des budgets

Budgets de tokens, coûts et temps avec actions SLO : avertir, limiter ou bloquer.

04

Pipeline adaptatif

Six étapes de pipeline avec basculements par profil et métriques en temps réel.

05

Fusion de Recherche Hybride

Combine la correspondance de mots-clés BM25, les embeddings sémantiques et les scores de proximité du graphe via Reciprocal Rank Fusion (RRF).

06

Overview enrichi de connaissances

ctx_overview affiche les faits de connaissance pertinents et les hotspots du Property Graph aux côtés du résumé d'architecture.

07

Throttling progressif de recherche

Des indices échelonnés guident l'agent lorsque les recherches répétées retournent des résultats décroissants, réduisant les tokens gaspillés.

08

Mode Terse

Mode de réponse concise configurable qui supprime les explications verbeuses, idéal pour les développeurs expérimentés et les longues sessions.

09

Potentiel de contexte (Φ)

Chaque élément de contexte est évalué par une fonction potentielle à six facteurs combinant pertinence, structure, récence, historique, coût et redondance.

10

Compilateur de contexte

La sélection gloutonne classée par Φ construit des paquets de contexte minimaux dans tout budget de tokens, avec élimination automatique de la redondance.

11

Handles de contexte

Références différées et légères (@F1, @K3) qui reportent le chargement du contenu jusqu'au besoin — pointeurs de contexte à coût zéro pour l'efficacité en tokens.

Protocol

Protocole d'Efficacité Cognitive (CEP)

Un protocole structuré pour maximiser la qualité du raisonnement IA grâce à une livraison de contexte optimisée.

CEP Protocol

protocol CEP

version v1

pillar Intelligence

status active

outils

10 MCP outils

LeanCTX route chaque requête à travers un pipeline adaptatif alimenté par des graphes. Il classifie l'intention de la tâche, fusionne BM25, embeddings sémantiques et proximité de graphes via Reciprocal Rank Fusion (RRF) pour la recherche, applique les budgets de tokens et de coûts, et enrichit les vues d'ensemble avec des faits de connaissance et des hotspots du graphe. Le throttling progressif et le mode terse maintiennent l'efficacité des longues sessions.

ctx_intent

Structured intent input (optional) — submit compact JSON or short text; server also infers intents automatically from tool calls.

ctx_overview

Task-relevant project map — use at session start.

ctx_preload

Proactive context loader — caches task-relevant files, returns L-curve-optimized summary (~50-100 tokens vs ~5000 for individual reads).

ctx_prefetch

Predictive prefetch — prewarm cache for blast radius files (graph + task signals) within budgets.

ctx_dedup

Cross-file dedup: analyze or apply shared block references.

ctx_response

Compress LLM response text (remove filler, apply TDD).

ctx_benchmark

Benchmark compression modes for a file or project.

ctx_context

Session context overview — cached files, seen files, session state.

ctx_routes

List HTTP routes/endpoints extracted from the project. Supports Express, Flask, FastAPI, Actix, Spring, Rails, Next.js.

ctx_feedback

Harness feedback for LLM output tokens/latency (local-first). Actions: record|report|json|reset|status.

Intelligence

Documentation associée

intelligence layer profiles cep

Vérification

Chaque sortie porte une preuve

LeanCTX génère des artefacts de preuve pour chaque session : quels fichiers ont été lus, ce qui a été compressé, quelles vérifications ont réussi et comment les tokens ont été dépensés. Cela rend le travail IA auditable, reproductible et fiable.

Cookbook & SDK

Exemples réels contre un serveur en cours d'exécution (<code>/v1/tools/call</code>).

Vérification & CI

Guardrails : clippy/tests + vérification de sortie.

Mémoire (Politiques)

Feedback, relations, modes de récupération.

Confiance

Ce que LeanCTX fait, stocke - et ne fait jamais.

Explorer les outils d'intelligence