オープンスタンダード · v1.0-draft

統制されたコンテキストパイプラインとは何か
というものか?

CIS Benchmarksは、強化されたサーバーがどのようなものであるかを定義します。Context Governance Benchmarkは、統制されたコンテキストパイプラインがどのようなものであるかを定義します:6つのドメインにわたる32の測定可能でツール非依存なコントロールを、4段階のマチュリティグレードでスコアリングしたもの。セキュリティチーム、調達部門、プレスなどから引用可能 — CC-BY 4.0のもとで無料。

仕様を読む LeanCTX自己評価(C2)

ステータス: v1.0-draft, レビュー前。 カタログは公開され、フィードバックを募集しています。v1.0-finalには、3つ以上の外部レビューアが必要です。それまでは、リリース済み標準として引用せず、ドラフトとして引用してください。

カタログ

32のコントロール、 6つのドメイン。

各コントロールは、要件、重要性、具体的な測定方法、およびレベルを記述します。3つのレベルが積み重なっています:Basic(12コントロールの基礎)、Hardened(顧客または規制データのための15コントロール)、Audited(サードパーティ検証可能な保証を持つ5コントロール)。

CGB-1 · 6 コントロール

機密性およびマスキング

資格情報、個人データ、および規制対象の識別子は、信頼境界を越えてはなりません。検出、マスキング、およびそれらを取り巻く保証。

CGB-2 · 5 コントロール

出所と完全性

モデルとのあらゆるやり取りにおいて:コンテキストに何が入り、どこから来たか、変更されたか?ソースの帰属、変換の開示、改ざん防止。

CGB-3 · 5 コントロール

予算とリソース制御

1つのプロンプトが多数のツール呼び出しやサブエージェントに展開される。制限、帰属、請求書が出る前に暴走的な消費を止めること。

CGB-4 · 6 コントロール

監査と証拠

ガバナンス上の主張は、その背後にある記録が強い限りにおいてのみ強力である。何がログにされるか、それがどのように保護されるか、そして第三者が検証できるかどうか。

CGB-5 · 5 コントロール

アクセススコープ

エージェントは何に到達できるのか、誰の権限で?ファイルシステム、コマンド実行、ネットワーク、およびツール表面の境界 — 監査されていないrootシェルではなく、アシスタントであること。

CGB-6 · 5 コントロール

ライフサイクルと保持

キャッシュ、セッションストア、長期メモリ、共有知識:蓄積された状態がどのように制限され、期限切れになり、削除され、時間を通じて正直に保たれるか。

スコアリング

4つのグレード、 C0で隠れてはいけない。

コントロールのスコアはMet(1.0)、Partial(0.5、ギャップを記述)またはNot met(0)。あるレベルのスコアは、適用可能なコントロールに対するポイントである。グレードはパイプラインがクリアする最高のしきい値であり、C1未満の場合は単に評価されない。

C1

Foundational

Basic ≥ 75%

C2

Managed

Basic ≥ 90% かつ Hardened ≥ 50%

C3

Hardened

Basic = 100%、Hardened ≥ 80%、Audited ≥ 40%、すべてのMetなコントロールが証拠にリンクする

C4

Audited

Basic = 100%、Hardened = 100%、Audited ≥ 80%、独立して検証されている

C3以上からは、すべてのMetの主張は、レビュー担当者が開ける証拠にリンクする。C4からは、評価自体が独立して検証される — セルフアセスメントは設計上、C3で止まる。

LeanCTXによる評価

自己評価 C2 — およびギャップの提示。

仕様はツールに依存しませんが、この部分は異なります。LeanCTXはv1.0-draftに対してC2—Managed: Basic 96% · Hardened 80% · Audited 50%で自己評価を行います。主張をハード検証できない場合、コントロールは格下げされ、引き上げられることはありません。

公開されているギャップには、CGB-1.4(fail-closed redaction coverageは慣習的であり、CIゲートによって構造的に証明されたものではない)や、第三者による検証を待っているいくつかのAuditedレベルのコントロールが含まれます。すべてのPartialおよびNot metを含む、コントロールごとの完全な所見は、公開自己評価に記載されています。

独自のセットアップを評価する: lean-ctx policy coverage --benchmark cgb は、解決されたポリシーパックをテスト可能なコントロール(パターン名による信頼ではなく、合成フィクスチャ)に対して静的にチェックします。

Governance

バージョン管理済み 仕様書のように。

コントロールIDは永続的であり、再利用されることはありません。実質的な変更は、14日間のコメント期間と記録された異議申し立てを伴うRFCライトプロセスを経ます。カタログは毎年改訂され、ドラフトには常にラベルが付けられます。ライセンス: CC-BY 4.0。

レビュー委員会 — 参加者募集中。 v1.0-finalは、少なくとも3名の名前が挙がる外部レビュアー(セキュリティ、コンプライアンス、またはプラットフォームエンジニアリングの実務家で、単一ベンダーの商業的利害関係がないこと)がすべてのドメインを検証した後に出荷されます。レビュアーの名前はリリースされた仕様書に記載されます。Issueからボランティアする →

FAQ

ベンチマーク、回答済み。

Context Governance Benchmarkとは何ですか?

バージョン管理され、ツールに依存しない32の測定可能なコントロールを6つのドメイン(機密性&マスキング、プロベナンス、予算制御、監査&証拠、アクセススコープ、ライフサイクル&保持)にわたってカタログ化し、ガバナンスされたコンテキストパイプラインがどのようなものであるかを定義しています。これはCIS Benchmarksがハードニングされたサーバーがどのようなものであるかを定義する方法に似ています。CC-BY 4.0の下で公開され、C1からC4の4つの成熟度グレードでスコアリングされます。

CGBはLeanCTXの標準ですか?

LeanCTXメンテナーが仕様書を編集しますが、コントロール自体は意図的にツールに依存しないものになっています。どのコントロールにもLeanCTXの概念は現れず、CIでは中立性リンターがそれを強制し、あらゆるベンダーまたは社内パイプラインが自己評価できます。LeanCTXは、ギャップを含め、独自の自己評価を別のドキュメントとして公開します。

LeanCTX自体は何をスコアリングしますか?

v1.0-draftに対して、LeanCTXはC2—Managed (Basic 96%, Hardened 80%, Audited 50%)で自己評価を行い、ギャップが公開されています。その中で、fail-closed redaction coverageは構造的に証明されたというより慣習的であり、いくつかのAuditedレベルのコントロールには第三者による検証が必要です。完璧な自己スコアは、製品についてよりも評価について多くを語るでしょう。

v1.0は最終版ですか?

いいえ — v1.0-draftが公開されており、レビューに開かれています。リリースがv1.0-finalとなるのは、少なくとも3名の名前が挙がる外部レビュアー(セキュリティ、コンプライアンス、またはプラットフォームエンジニアリングの実務家)がすべてのドメインを検証した後です。それまでは、評価はドラフトステータスを引用する必要があります。レビューアになりたいですか?仕様リポジトリでIssueを開いてください。

自分のパイプラインを評価する方法は?

仕様をクローンし、アセスメントテンプレートを使用して32のコントロールを処理し、各コントロールについて記載されている測定方法を用いて「満たしている」「部分的に満たしている」「満たしていない」、または「該当なし」で評価します。LeanCTXユーザーは一部を自動化できます:lean-ctx policy coverage --benchmark cgb は、解決されたポリシーパックをテスト可能なコントロールに対して静的にチェックし、コントロールごとの結果を出力します。

モデルにフィードされるレイヤーを統治する。

仕様書を読み、パイプラインを評価し、問題を報告するか、LeanCTXがローカルで永続的に無料でコントロールを実装する方法を見る。CGBがコントロールを定義し、Open Context Protocolがワイヤー形式を定義し、コンプライアンスマッピングが両方をEU AI Act、ISO 42001、およびSOC 2に接続する。