Estándar abierto · v1.0-draft

¿Cómo se ve un pipeline de contexto gobernado
realmente?

Los CIS Benchmarks definen qué es un servidor endurecido. El Context Governance Benchmark define qué es un pipeline de contexto gobernado: 32 controles medibles e independientes de herramientas en 6 dominios, puntuados en cuatro grados de madurez. Citables por equipos de seguridad, adquisiciones y prensa — gratis bajo CC-BY 4.0.

Leer la especificación Autoevaluación LeanCTX (C2)

Estado: v1.0-draft, pre-revisión. El catálogo está publicado y abierto a comentarios; v1.0-final requiere ≥ 3 revisores externos nombrados. Hasta entonces, no lo cite como un estándar lanzado — cite el borrador.

El catálogo

32 controles, 6 dominios.

Cada control establece un requisito, por qué es importante, un método de medición concreto y un nivel. Tres niveles se construyen unos sobre otros: Básico (el piso de 12 controles), Endurecido (15 controles para datos de clientes o regulados) y Auditado (5 controles con garantía verificable por terceros).

CGB-1 · 6 controles

Sensibilidad y Redacción

Los credenciales, datos personales e identificadores regulados nunca deben cruzar el límite de confianza. Detección, redacción y las garantías en torno a ellos.

CGB-2 · 5 controles

Procedencia e Integridad

Para cualquier interacción con un modelo: qué entró en el contexto, de dónde vino, ¿ha sido alterado? Atribución de fuente, divulgación de transformaciones, evidencia de manipulación.

CGB-3 · 5 controles

Control de Presupuesto y Recursos

Un prompt se expande en muchas llamadas a herramientas y subagentes. Límites, atribución y detención del consumo descontrolado antes de la factura.

CGB-4 · 6 controles

Auditoría y Evidencia

Las afirmaciones de gobernanza solo son tan sólidas como los registros que las respaldan. Qué se registra, cómo está protegido y si un tercero puede verificarlo.

CGB-5 · 5 controles

Alcance de Acceso

Qué puede alcanzar un agente, bajo qué autoridad? Límites del sistema de archivos, ejecución de comandos, red y superficie de herramientas: asistente, no shell root sin auditar.

CGB-6 · 5 controles

Ciclo de Vida y Retención

Cachés, almacenes de sesiones, memoria a largo plazo, conocimiento compartido: cómo el estado acumulado está limitado, caduca, se elimina y se mantiene honesto con el tiempo.

Puntuación

Cuatro grados, sin C0 que esconderse.

Los controles puntúan Cumplido (1.0), Parcial (0.5, se describe la brecha) o No cumplido (0). La puntuación de un nivel son puntos sobre los controles aplicables. El grado es el umbral más alto que supera el pipeline: por debajo de C1 simplemente no está calificado.

C1

Foundational

Basic ≥ 75%

C2

Managed

Básico ≥ 90% y Reforzado ≥ 50%

C3

Hardened

Básico = 100%, Reforzado ≥ 80%, Auditado ≥ 40%, cada control Cumplido enlaza evidencia

C4

Audited

Básico = 100%, Reforzado = 100%, Auditado ≥ 80%, verificado de forma independiente

A partir de C3, toda afirmación Cumplida enlaza evidencia que un revisor puede abrir. A partir de C4, la evaluación en sí está verificada de forma independiente: las autoevaluaciones se detienen en C3 por diseño.

LeanCTX, evaluado

Nos autoevaluamos C2 — y mostramos las brechas.

La especificación es agnóstica a herramientas; esta parte no lo es. LeanCTX se autoevalúa contra v1.0-draft en C2 — Gestionado: Básico 96% · Reforzado 80% · Auditado 50%. Cuando una afirmación no pudo ser verificada de forma rigurosa, el control se califica a la baja, no al alza.

Las brechas publicadas incluyen CGB-1.4 (la cobertura de redacción fail-closed es convencional, no está estructuralmente probada por una puerta de CI) y varios controles de nivel Auditado que esperan verificación de terceros. Los hallazgos completos por control — incluyendo cada Parcial y No cumplido — están en la autoevaluación pública.

Evalúe su propio entorno: lean-ctx policy coverage --benchmark cgb comprueba estáticamente su paquete de políticas resuelto contra los controles comprobables — artefactos sintéticos, no confianza en nombres de patrones.

Governance

Versionado como una especificación.

Los IDs de control son permanentes y nunca se reutilizan. Los cambios sustanciales pasan por un proceso tipo RFC con una ventana de comentarios de 14 días e inconformidad registrada. El catálogo se revisa anualmente; los borradores siempre están etiquetados. Licencia: CC-BY 4.0.

Junta de revisión — convocatoria abierta. v1.0-final se lanza una vez que ≥ 3 revisores externos nombrados (expertos en seguridad, cumplimiento o ingeniería de plataformas, sin participación comercial de un único proveedor) han trabajado en cada dominio. Los revisores están nombrados en la especificación publicada. Voluntariado a través de un problema →

FAQ

El benchmark, respondido.

¿Qué es el Context Governance Benchmark?

Un catálogo versionado y agnóstico a herramientas de 32 controles medibles en 6 dominios (sensibilidad y redacción, procedencia, control presupuestario, auditoría y evidencia, alcance de acceso, ciclo de vida y retención) que define qué es un pipeline de contexto gobernado, al igual que los CIS Benchmarks definen qué es un servidor reforzado. Se publica bajo CC-BY 4.0 y se puntúa en cuatro grados de madurez, C1 a C4.

¿Es el CGB un estándar de LeanCTX?

Los mantenedores de LeanCTX editan la especificación, pero los controles son deliberadamente agnósticos a herramientas: ningún concepto de LeanCTX aparece en ningún control, un linter de neutralidad lo aplica en CI, y cualquier pipeline de proveedor o interno puede autoevaluarse. LeanCTX publica su propia autoevaluación como documento separado — incluyendo las brechas.

¿Qué puntúa LeanCTX por sí mismo?

Contra v1.0-draft, LeanCTX se autoevalúa en C2 — Gestionado (Básico 96%, Reforzado 80%, Auditado 50%), con las brechas publicadas: entre ellas, la cobertura de redacción fail-closed es convencional más que estructuralmente probada, y varios controles de nivel Auditado necesitan verificación de terceros. Una puntuación perfecta de autoevaluación diría más sobre la evaluación que sobre el producto.

¿Es v1.0 final?

No — v1.0-draft está publicado y abierto para revisión. El lanzamiento se convierte en v1.0-final una vez que al menos tres revisores externos nombrados (expertos en seguridad, cumplimiento o ingeniería de plataformas) han trabajado en cada dominio. Hasta entonces, las evaluaciones deben citar el estado de borrador. ¿Quiere ser un revisor? Abra un problema en el repositorio de la especificación.

¿Cómo evalúo mi propio pipeline?

Clona la especificación, trabaja a través de los 32 controles con la plantilla de evaluación y califica cada control como Cumplido, Parcial, No cumplido o N/A utilizando su método de medición declarado. Los usuarios de LeanCTX pueden automatizar parte de esto: lean-ctx policy coverage --benchmark cgb comprueba estáticamente el paquete de políticas resuelto contra los controles evaluables e imprime los resultados por control.

Gobierna la capa que alimenta tus modelos.

Lee la especificación, evalúa tu pipeline, presenta problemas o descubre cómo LeanCTX implementa los controles localmente, gratis para siempre. CGB define los controles; el Open Context Protocol define el formato de transmisión; los mapeos de cumplimiento conectan ambos con EU AI Act, ISO 42001 y SOC 2.