আউটপুট যাচাইকরণ এবং মডেল রাউটিং

lean-ctx-এ একটি Quality Guardrail রয়েছে যা সংকুচিত আউটপুটের অখণ্ডতা যাচাই করে।

যাচাইকরণ পরীক্ষা

সংকোচনের পরে, lean-ctx নির্ধারণমূলক পরীক্ষা চালায়।

পাথ অ্যাঙ্করিং

ফাইল পাথ নিষ্কাশন করে এবং সংরক্ষণ যাচাই করে।

শনাক্তকারী পরীক্ষা

ফাংশন এবং স্ট্রাকচারের নাম শনাক্ত করে।

লাইন নম্বর সামঞ্জস্য

রেফারেন্সকৃত লাইন নম্বর প্রকৃত গণনা অতিক্রম না করে তা যাচাই করে।

কাঠামোগত অখণ্ডতা

কোড ব্লকে ভারসাম্যযুক্ত বন্ধনী পরীক্ষা করে।

কনফিগারেশন

যাচাইকরণ প্রোফাইল অনুযায়ী কনফিগারযোগ্য।

# Profile-specific verification settings
[verification]
enabled = true
# Optional explicit mode (recommended for clarity):
#   "warn" (default) -> FAIL only on High severity warnings
#   "fail"           -> FAIL on Medium+High warnings (strict)
mode = "warn"
check_paths = true
check_identifiers = true
check_line_numbers = false  # opt-in
check_structure = true

# Legacy alias (still supported):
# strict_mode = true

ফলাফল ফর্ম্যাট

সতর্কতা পাওয়া গেলে [VERIFY] লাইন যোগ করা হয়।

[VERIFY] WARN(mangled_identifier=2, missing_path=1) loss=15.0%
[VERIFY] FAIL(brace_mismatch=1, missing_path=1) loss=40.0%

Proof artifacts (ContextProofV2)

82 Lean4 theorems back the proof system, covering policy invariants (PathJail, Budget, Scope), compression safety, and the terse engine (TerseQuality, TerseEngine).

# MCP
ctx_proof action="export" format="summary"

# CLI
lean-ctx proof --summary

Verification observability (versioned stats)

# MCP
ctx_verify action="stats" format="json"

# CLI
lean-ctx verify --json

ইন্টেন্ট-ভিত্তিক মডেল রাউটিং

lean-ctx প্রতিটি কাজকে তিনটি মাত্রায় শ্রেণীবদ্ধ করে।

রাউটিং মাত্রা

মাত্রা	কাজের ধরন	মডেল স্তর
What	Explore, Debug	Fast
How	Review, FixBug, Test	Standard
Do	Generate, Refactor, Deploy	Premium

ctx_intent আউটপুট

ctx_intent এখন প্রস্তাবিত মডেল স্তর ফেরত দেয়।

INTENT_OK id=42 type=fix_bug source=heuristic conf=90% subj=file(auth.rs)
| route: dimension=how model_tier=standard reason=fix_bug(how) + complexity -> standard

অভিযোজিত ML সংকোচন

Thompson Sampling ব্যবহার করে সর্বোত্তম সংকোচন থ্রেশহোল্ড শিখে।

Thompson Sampling ব্যান্ডিট

তিনটি বাহু বিভিন্ন থ্রেশহোল্ড নিয়ে প্রতিযোগিতা করে।

Threshold Bandits (Thompson Sampling):
  rs_feedback (pulls: 120):
    conservative: α=15.2 β=8.1 mean=65% entropy=1.20 jaccard=0.80
    balanced:     α=22.3 β=5.2 mean=81% entropy=0.90 jaccard=0.70
    aggressive:   α=8.4 β=12.0 mean=41% entropy=0.60 jaccard=0.55

ফিডব্যাক লুপ

প্রতিটি সংকোচন ফলাফল ব্যান্ডিট সিস্টেমে ফিড করে।

ড্যাশবোর্ড API

ড্যাশবোর্ড API-এর মাধ্যমে যাচাইকরণ পরিসংখ্যান অ্যাক্সেস করুন।

# Verification stats
curl http://localhost:3179/api/verification

# Prometheus metrics (includes verification counters)
curl http://localhost:3179/metrics | grep verification