Reproducibilidad
Cómo hacer ejecuciones de agentes reproducibles: inputs estables, políticas explícitas, persistencia de sesión y puertas de verificación.
Qué debe permanecer estable
La reproducibilidad comienza con inputs estables - el grafo de herramientas solo es determinista si el entorno lo es.
- Misma raíz de proyecto + rutas permitidas
- Misma configuración y política de memoria
- Mismo código + dependencias (lockfiles)
Políticas como contrato
Los ajustes de memoria y verificación definen qué se persiste y qué checks deben mantenerse.
# ~/.lean-ctx/config.toml
[memory]
policy = "balanced"
[verification]
enabled = true Consejo: versiona y revisa los cambios de política.
Artefactos de sesión
Las sesiones capturan lo que pasó: llamadas de herramientas, escrituras de memoria, relaciones y salidas.
# Start a server with a fixed project root
lean-ctx serve --host 127.0.0.1 --port 8080 --project-root /path/to/repo # Example tool calls that leave an audit trail
ctx_session("load", { id: "..." })
ctx_knowledge("remember", { category: "...", key: "...", value: "..." }) Puertas CI
Trata clippy/tests + checks de verificación como puertas de calidad innegociables.
# CI gates / local checks
cd rust
cargo fmt -- --check
cargo clippy --all-features -- -D warnings
# SSOT drift gate (manifest must be up-to-date)
cargo run -q --bin gen_mcp_manifest
git diff --exit-code ../website/generated/mcp-tools.json
# Core tests (deterministic + bounded)
cargo test --all-features -- --test-threads=1
# Lightweight regression checks (stable thresholds)
cargo test -q --test savings_verification
# Proof artifact (machine-readable attestation, no secrets)
cargo run -q --bin lean-ctx -- proof --summary --no-write Cookbook: ejemplos end-to-end
Ejecuta integraciones reales contra un servidor en ejecución (sin datos de prueba).
cd cookbook
npm ci
npm run memory-playground
npm run graph-explorer