v0.2.0 4/5 e2e success 247 tests · 93% coverage

Infinite
Problem Engine

LangGraph + Claude로 알고리즘 문제를 자체 생산한다.
문제 설계 → 정해 → 적대적 엣지케이스 → stress test → 난이도 평가까지 한 파이프라인.

핵심 지표

4/5
e2e success rate
Run 11/12 2회 연속
247
tests passed
+ 3 skipped
93%
coverage
≥ 80% 기준 통과
11
dependencies
Core 6 + Dev 5

아키텍처

LangGraph 6 노드 + decision routing — 단일 ProblemState dict가 모든 노드 사이를 흐른다.

🛡️
4-Tier Sandbox
LLM 생성 코드는 격리된 환경에서만 실행 — Docker / nsjail / sandbox-exec / RLIMIT 자동 선택

최근 진행 (v0.3.0 Round 23 M4 Adversarial Review)

v0.3.0 RFC PR #4 완료 — M4 Reviewer 노드 (Coder solution adversarial gate). graph: coder → reviewer → {approve→executor | reject→coder retry with weaknesses}. 7 노드 체인. 417 tests pass (+16). Next: v0.3.0 release e2e DoD 측정 (5 algorithm × 3 run, ≥80%).

PR제목타입임팩트
전체 Run 12회 결과 매트릭스 보기 →

핵심 원칙

🛡️

Sandboxed Local Execution

LLM 생성 코드는 격리된 환경 (Docker / nsjail / sandbox-exec / RLIMIT 4-tier) 안에서만 실행

🔄

Resumable & Observable

LangGraph SqliteSaver checkpointing + 모든 LLM 호출 raw trace 보존 → replay 모드 0-cost 재현

📏

Bounded

max_iter (안전망) + per-node retry budget (정밀 제어) + max_cost_usd (비용 가드) 3중 제어

📊

Post-Verification Difficulty

난이도는 검증 후 사후 측정 — calibration anchor 동봉으로 분산 ↓