Открытый стандарт · v1.0-draft

Как выглядит управляемый контекстный конвейер
на самом деле?

CIS Benchmarks определяют, что такое защищенный сервер. Context Governance Benchmark определяет, что такое управляемый контекстный конвейер: 32 измеримых контроля, нейтральных к инструментам в 6 доменах, оцененные по четырем уровням зрелости. Цитируется командами безопасности, закупками и прессой — бесплатно по CC-BY 4.0.

Прочитать спецификацию Самооценка LeanCTX (C2)

Статус: v1.0-draft, до обзора. Каталог опубликован и открыт для отзывов; v1.0-final требует ≥ 3 внешних рецензентов. До тех пор не цитируйте его как выпущенный стандарт — цитируйте черновик.

Каталог

32 контроля, 6 доменов.

Каждый контроль описывает требование, важность этого требования, конкретный метод измерения и уровень. Три уровня развиваются последовательно: Basic (базовый набор из 12 контролей), Hardened (15 контролей для данных клиентов или регулируемых данных) и Audited (5 контролей с подтверждением от сторонних организаций).

CGB-1 · 6 контроли

Чувствительность и удаление

Учетные данные, личные данные и регулируемые идентификаторы никогда не должны пересекать границу доверия. Обнаружение, маскирование и гарантии вокруг них.

CGB-2 · 5 контроли

Происхождение и целостность

Для любого взаимодействия с моделью: что попало в контекст, откуда оно взялось, было ли изменено? Атрибуция источника, раскрытие преобразований, доказательство несанкционированного изменения.

CGB-3 · 5 контроли

Бюджет и контроль ресурсов

Один промпт может разветвиться во множество вызовов инструментов и под-агентов. Ограничения, атрибуция и остановка бесконтрольного расхода до выставления счета.

CGB-4 · 6 контроли

Аудит и доказательства

Заявления о управлении сильны ровно настолько, насколько надежны записи, которые их подтверждают. Что логируется, как это защищено и может ли это проверить третья сторона.

CGB-5 · 5 контроли

Ограничение доступа

К чему агент может получить доступ и на чье разрешение? Файловая система, выполнение команд, сетевые границы и границы инструментов — помощник, а не неаудированный root shell.

CGB-6 · 5 контроли

Жизненный цикл и хранение

Кэши, сеансовые хранилища, долговременная память, общие знания: как ограничен, истекает, удаляется и сохраняется честным со временем накопленное состояние.

Оценка

Четыре уровня оценки, без C0, чтобы прятаться.

Контроли оцениваются как Выполнен (1.0), Частично (0.5, описан пробел) или Не выполнен (0). Оценка уровня — это сумма баллов по применимым контролям. Уровень определяется самым высоким пройдевшим порогом — ниже C1 он просто не оценивается.

C1

Foundational

Basic ≥ 75%

C2

Managed

Базовый ≥ 90% и Усиленный ≥ 50%

C3

Hardened

Базовый = 100%, Усиленный ≥ 80%, Аудированный ≥ 40%, каждый выполненный контроль связан с доказательством

C4

Audited

Базовый = 100%, Усиленный = 100%, Аудированный ≥ 80%, независимо проверенный

Начиная с C3, каждое заявление Выполнено должно быть связано с доказательством, которое может открыть рецензент. Начиная с C4, сама оценка проходит независимую проверку — самооценки по дизайну останавливаются на уровне C3.

LeanCTX, оценен

Мы оцениваем себя C2 — и показываем пробелы.

Спецификация нейтральна к инструментам; эта часть — нет. LeanCTX самостоятельно оценивает себя по v1.0-draft на уровне C2 — Managed: Basic 96% · Hardened 80% · Audited 50%. Если утверждение не может быть жестко проверено, контроль понижается в оценке, а не повышается.

Опубликованные пробелы включают CGB-1.4 (покрытие маскирования с отказом — это общепринятая практика, а не структурно доказанная CI-шлюзом) и несколько контролей уровня Audited, ожидающих сторонней проверки. Полные результаты по каждому контролю — включая каждый Partial и Not met — представлены в общей самооценке.

Оцените собственную конфигурацию: lean-ctx policy coverage --benchmark cgb статически проверяет ваш разрешенный пакет политик на соответствие тестируемым контролям — синтетические фикстуры, а не доверие к именам шаблонов.

Governance

Версионировано как спецификация.

Идентификаторы контролей постоянны и никогда не повторно используются. Существенные изменения проходят процесс RFC-light с 14-дневным окном комментариев и зафиксированным несогласием. Каталог пересматривается ежегодно; черновики всегда маркируются. Лицензия: CC-BY 4.0.

Совет по обзору — открытый призыв. v1.0-final будет выпущен, как только ≥ 3 имени внешних рецензентов (специалисты по безопасности, комплаенсу или платформенной инженерии, без коммерческой заинтересованности одного поставщика) пройдут через каждую область. Имена рецензентов указываются в опубликованной спецификации. Стать волонтером через issue →

FAQ

Бенчмарк, отвеченный.

Что такое Context Governance Benchmark?

Версионированный, нейтральный к инструментам каталог из 32 измеримых контролей в 6 областях (чувствительность и маскирование, происхождение, контроль бюджета, аудит и доказательства, область доступа, жизненный цикл и хранение), который определяет, что такое управляемый контекстный конвейер — подобно тому, как CIS Benchmarks определяют, что такое защищенный сервер. Он опубликован под лицензией CC-BY 4.0 и оценивается по четырем уровням зрелости: C1–C4.

Является ли CGB стандартом LeanCTX?

Поддерживающие разработчики LeanCTX редактируют спецификацию, но контрольные точки намеренно нейтральны к инструментам: в любом контроле отсутствуют концепции LeanCTX, линтер нейтральности обеспечивает это в CI, и любой поставщик или внутренняя система может провести самооценку. LeanCTX публикует собственную самооценку как отдельный документ — включая пробелы.

Что оценивает сам LeanCTX?

По v1.0-draft, LeanCTX самостоятельно оценивается на уровне C2 — Managed (Basic 96%, Hardened 80%, Audited 50%), с опубликованными пробелами: среди них покрытие маскирования с отказом является общепринятой практикой, а не структурно доказанной, и несколько контролей уровня Audited требуют сторонней проверки. Идеальная самооценка говорит больше о процессе оценки, чем о самом продукте.

Это v1.0 final?

Нет — опубликован черновик v1.0-draft и он открыт для обзора. Релиз станет v1.0-final только после того, как по крайней мере трое имени внешних рецензентов (специалисты по безопасности, комплаенсу или платформенной инженерии) пройдут через каждую область. До тех пор оценки должны указывать на статус черновика. Хотите стать рецензентом? Откройте issue в репозитории спецификации.

Как мне оценить свой собственный пайплайн?

Клонируйте спецификацию, пройдите 32 элемента управления с помощью шаблона оценки и присвойте каждой проверке статус «Выполнено», «Частично выполнено», «Не выполнено» или «Н/П», используя указанный метод измерения. Пользователи LeanCTX могут автоматизировать часть этого процесса: lean-ctx policy coverage --benchmark cgb статически проверяет разрешенный пакет политик на соответствие тестируемым элементам управления и выводит результаты для каждой проверки.

Управляйте слоем, который питает ваши модели.

Изучите спецификацию, оцените ваш конвейер, подайте заявку на проблему — или узнайте, как LeanCTX реализует эти элементы локально, бесплатно навсегда. CGB определяет элементы управления; Open Context Protocol определяет формат передачи данных; карты соответствия связывают их с EU AI Act, ISO 42001 и SOC 2.