上下文可观测性
将上下文转化为可观测、可控的资产。
上下文SLOs
为你的上下文指标定义服务级别目标。
配置
在.lean-ctx目录中创建slos.toml文件。
# .lean-ctx/slos.toml
[[slo]]
name = "context_budget"
metric = "session_context_tokens"
threshold = 50000
action = "warn" # warn | throttle | block
[[slo]]
name = "cost_per_session"
metric = "session_cost_usd"
threshold = 1.00
action = "throttle"
[[slo]]
name = "compression_efficiency"
metric = "compression_ratio"
threshold = 0.3
direction = "min"
action = "warn" 可用指标
session_context_tokens 当前会话中的总上下文token数
session_cost_usd 会话的估计USD成本
compression_ratio 压缩与原始token的比率
shell_invocations 执行的shell命令数
tool_calls_total MCP工具调用总数
SLO操作
| 操作 | 行为 |
|---|---|
warn | 在工具输出中附加警告 |
throttle | 警告并可能降低输出密度 |
block | 阻止非必要的工具调用 |
MCP命令
ctx_session slo # Show current SLO status
ctx_session slo reload # Reload SLOs from disk
ctx_session slo history # Show violation history
ctx_session slo clear # Clear violation log 异常检测
自动检测异常token消耗模式。
工作原理
lean-ctx使用Welford在线算法:
- 50次工具调用的滑动窗口EMA
- >3x标准差时触发警报
- 事件在TUI和仪表板中可见
追踪的指标
目前追踪tokens_per_call。
Prometheus指标
以Prometheus格式导出数据。
端点
# Start dashboard with metrics endpoint
lean-ctx dashboard
# Scrape metrics
curl http://localhost:3000/metrics 可用指标
lean_ctx_tokens_saved_total
lean_ctx_compression_ratio
lean_ctx_session_cost_usd
lean_ctx_tool_calls_total
lean_ctx_slo_violations_total
lean_ctx_cache_hit_rate
lean_ctx_anomalies_total
lean_ctx_session_uptime_seconds Grafana集成
将Prometheus指向/metrics端点。
零PII保证
只导出计数器、仪表和比率。
会话对比
并排比较两个会话。
使用方法
# Compare two sessions (MCP)
ctx_session diff <session_a> <session_b>
ctx_session diff <session_a> <session_b> json
# List available sessions
ctx_session list 比较内容
差异引擎比较完整的会话结构:
- 文件: 添加、删除、模式更改
- 发现: 新观察vs之前的会话
- 决策: 架构选择
- 统计: 工具调用、节省的token、命令
仪表板API端点
| 端点 | 描述 |
|---|---|
/api/slos | 当前SLO状态和违规历史 |
/api/anomaly | 异常检测摘要 |
/metrics | Prometheus格式导出 |
/api/events | 事件日志(最近200条) |