LangGraph + Claude로 알고리즘 문제를 자체 생산한다.
문제 설계 → 정해 → 적대적 엣지케이스 → stress test → 난이도 평가까지 한 파이프라인.
LangGraph 6 노드 + decision routing — 단일 ProblemState dict가 모든 노드 사이를 흐른다.
v0.3.0 RFC PR #4 완료 — M4 Reviewer 노드 (Coder solution adversarial gate). graph: coder → reviewer → {approve→executor | reject→coder retry with weaknesses}. 7 노드 체인. 417 tests pass (+16). Next: v0.3.0 release e2e DoD 측정 (5 algorithm × 3 run, ≥80%).
| PR | 제목 | 타입 | 임팩트 |
|---|
LLM 생성 코드는 격리된 환경 (Docker / nsjail / sandbox-exec / RLIMIT 4-tier) 안에서만 실행
LangGraph SqliteSaver checkpointing + 모든 LLM 호출 raw trace 보존 → replay 모드 0-cost 재현
max_iter (안전망) + per-node retry budget (정밀 제어) + max_cost_usd (비용 가드) 3중 제어
난이도는 검증 후 사후 측정 — calibration anchor 동봉으로 분산 ↓