文档

上下文可观测性

上下文可观测性

将上下文转化为可观测、可控的资产。

上下文SLOs

为你的上下文指标定义服务级别目标。

配置

在.lean-ctx目录中创建slos.toml文件。

# .lean-ctx/slos.toml
[[slo]]
name = "context_budget"
metric = "session_context_tokens"
threshold = 50000
action = "warn"  # warn | throttle | block

[[slo]]
name = "cost_per_session"
metric = "session_cost_usd"
threshold = 1.00
action = "throttle"

[[slo]]
name = "compression_efficiency"
metric = "compression_ratio"
threshold = 0.3
direction = "min"
action = "warn"

可用指标

session_context_tokens

当前会话中的总上下文token数

session_cost_usd

会话的估计USD成本

compression_ratio

压缩与原始token的比率

shell_invocations

执行的shell命令数

tool_calls_total

MCP工具调用总数

SLO操作

操作行为
warn在工具输出中附加警告
throttle警告并可能降低输出密度
block阻止非必要的工具调用

MCP命令

ctx_session slo              # Show current SLO status
ctx_session slo reload       # Reload SLOs from disk
ctx_session slo history      # Show violation history
ctx_session slo clear        # Clear violation log

异常检测

自动检测异常token消耗模式。

工作原理

lean-ctx使用Welford在线算法:

  • 50次工具调用的滑动窗口EMA
  • >3x标准差时触发警报
  • 事件在TUI和仪表板中可见

追踪的指标

目前追踪tokens_per_call。

Prometheus指标

以Prometheus格式导出数据。

端点

# Start dashboard with metrics endpoint
lean-ctx dashboard

# Scrape metrics
curl http://localhost:3000/metrics

可用指标

lean_ctx_tokens_saved_total
lean_ctx_compression_ratio
lean_ctx_session_cost_usd
lean_ctx_tool_calls_total
lean_ctx_slo_violations_total
lean_ctx_cache_hit_rate
lean_ctx_anomalies_total
lean_ctx_session_uptime_seconds

Grafana集成

将Prometheus指向/metrics端点。

零PII保证

只导出计数器、仪表和比率。

会话对比

并排比较两个会话。

使用方法

# Compare two sessions (MCP)
ctx_session diff <session_a> <session_b>
ctx_session diff <session_a> <session_b> json

# List available sessions
ctx_session list

比较内容

差异引擎比较完整的会话结构:

  • 文件: 添加、删除、模式更改
  • 发现: 新观察vs之前的会话
  • 决策: 架构选择
  • 统计: 工具调用、节省的token、命令

仪表板API端点

端点描述
/api/slos当前SLO状态和违规历史
/api/anomaly异常检测摘要
/metricsPrometheus格式导出
/api/events事件日志(最近200条)