আউটপুট যাচাইকরণ এবং মডেল রাউটিং
lean-ctx-এ একটি Quality Guardrail রয়েছে যা সংকুচিত আউটপুটের অখণ্ডতা যাচাই করে।
যাচাইকরণ পরীক্ষা
সংকোচনের পরে, lean-ctx নির্ধারণমূলক পরীক্ষা চালায়।
পাথ অ্যাঙ্করিং
ফাইল পাথ নিষ্কাশন করে এবং সংরক্ষণ যাচাই করে।
শনাক্তকারী পরীক্ষা
ফাংশন এবং স্ট্রাকচারের নাম শনাক্ত করে।
লাইন নম্বর সামঞ্জস্য
রেফারেন্সকৃত লাইন নম্বর প্রকৃত গণনা অতিক্রম না করে তা যাচাই করে।
কাঠামোগত অখণ্ডতা
কোড ব্লকে ভারসাম্যযুক্ত বন্ধনী পরীক্ষা করে।
কনফিগারেশন
যাচাইকরণ প্রোফাইল অনুযায়ী কনফিগারযোগ্য।
# Profile-specific verification settings
[verification]
enabled = true
# Optional explicit mode (recommended for clarity):
# "warn" (default) -> FAIL only on High severity warnings
# "fail" -> FAIL on Medium+High warnings (strict)
mode = "warn"
check_paths = true
check_identifiers = true
check_line_numbers = false # opt-in
check_structure = true
# Legacy alias (still supported):
# strict_mode = true ফলাফল ফর্ম্যাট
সতর্কতা পাওয়া গেলে [VERIFY] লাইন যোগ করা হয়।
[VERIFY] WARN(mangled_identifier=2, missing_path=1) loss=15.0%
[VERIFY] FAIL(brace_mismatch=1, missing_path=1) loss=40.0% Proof artifacts (ContextProofV2)
82 Lean4 theorems back the proof system, covering policy invariants (PathJail, Budget, Scope), compression safety, and the terse engine (TerseQuality, TerseEngine).
# MCP
ctx_proof action="export" format="summary"
# CLI
lean-ctx proof --summary Verification observability (versioned stats)
# MCP
ctx_verify action="stats" format="json"
# CLI
lean-ctx verify --json ইন্টেন্ট-ভিত্তিক মডেল রাউটিং
lean-ctx প্রতিটি কাজকে তিনটি মাত্রায় শ্রেণীবদ্ধ করে।
রাউটিং মাত্রা
| মাত্রা | কাজের ধরন | মডেল স্তর |
|---|---|---|
| What | Explore, Debug | Fast |
| How | Review, FixBug, Test | Standard |
| Do | Generate, Refactor, Deploy | Premium |
ctx_intent আউটপুট
ctx_intent এখন প্রস্তাবিত মডেল স্তর ফেরত দেয়।
INTENT_OK id=42 type=fix_bug source=heuristic conf=90% subj=file(auth.rs)
| route: dimension=how model_tier=standard reason=fix_bug(how) + complexity -> standard অভিযোজিত ML সংকোচন
Thompson Sampling ব্যবহার করে সর্বোত্তম সংকোচন থ্রেশহোল্ড শিখে।
Thompson Sampling ব্যান্ডিট
তিনটি বাহু বিভিন্ন থ্রেশহোল্ড নিয়ে প্রতিযোগিতা করে।
Threshold Bandits (Thompson Sampling):
rs_feedback (pulls: 120):
conservative: α=15.2 β=8.1 mean=65% entropy=1.20 jaccard=0.80
balanced: α=22.3 β=5.2 mean=81% entropy=0.90 jaccard=0.70
aggressive: α=8.4 β=12.0 mean=41% entropy=0.60 jaccard=0.55 ফিডব্যাক লুপ
প্রতিটি সংকোচন ফলাফল ব্যান্ডিট সিস্টেমে ফিড করে।
ড্যাশবোর্ড API
ড্যাশবোর্ড API-এর মাধ্যমে যাচাইকরণ পরিসংখ্যান অ্যাক্সেস করুন।
# Verification stats
curl http://localhost:3179/api/verification
# Prometheus metrics (includes verification counters)
curl http://localhost:3179/metrics | grep verification