v1.0 91.2% Gate 862 tests Phase 3 (v2) M0~M6 완료

Infinite
Problem Engine

알고리즘 문제를, 코드가 독립적으로 검증할 수 있는 형태로 생성한다.

LangGraph + Claude. 핵심은 LLM 출력 신뢰가 아니라 — 정답을 코드가 알고리즘의 수학적 정의에서 유도하는 결정론적 검증, typed artifact 라우팅, 그리고 모든 변경을 막아서는 측정 게이트.

쉬운 설명부터 → 측정 Dashboard Phase 3 RFC

👋 처음 오셨나요? — 30초 설명

IPE 는 코딩 테스트 문제를 자동으로 만들어 주는 엔진이에요. AI 로 문제를 만들 때 가장 어려운 건 "그 정답이 진짜 맞는지" 아무도 보장 못 한다는 점인데, IPE 의 핵심은 정답을 AI 에게 다시 묻지 않고 — 그 알고리즘의 수학 정의를 담은 코드로 처음부터 다시 계산해 검산한다는 거예요. 그래서 "그럴듯한 오답"이 자동으로 걸러집니다.

용어가 생소해도 괜찮아요 — 전체 흐름을 비유와 실제 코드로 풀어 쓴 쉬운 설명 부터 보시면 됩니다. 그리고 아래 숫자들(91.2% 등)은 광고 문구가 아니라 전부 측정 결과예요.

→ 쉬운 설명으로 전체 따라가기

v1.0 측정 anchor

Phase 2c RCA3 final (CHANGES §67) — 추가 측정이 diminishing returns 라 판단해 동결(freeze)했다.

91.2%

Gate 통과율

52/57 · N=3

+64pp

v0 대비 개선

27% → 91.2%

algorithm catalog

symbolic verifier

99.1%

samples_engaged

verifier 실제 발동률

왜 이 산출물을 신뢰할 수 있나

해자는 "LLM 이 좋은 문제를 만든다"가 아니다. 네 가지 결정론적 장치다.

v1.0 실행 파이프라인

4개 LLM 노드 + 코드 검증 + 구조화 라우팅. 단일 typed state 가 노드 사이를 흐른다.

🔁

StructuredFeedback 라우팅

Executor 의 verifier 가 실패를 failure_mode + target_node 로 분류 → 책임 노드(architect/designer/coder)로 결정론 재라우팅. sample 불일치 + invariant 전부 통과면 architect expected_output 오류로 보고 back-route.

Phase 3 — v2 Agentic Graph 재공사

v1.0 은 성공했지만 산출물 자체는 toy 수준이다 — 알고리즘이 입력으로 노출돼 "무엇을 쓸지 알아내는" 핵심 역량이 빠져 있다. v2 는 알고리즘 은닉 · 기법 합성 · 구조 풍부한 hiring-grade 문제를 목표로 토폴로지를 재설계한다 — 단 typed 계약과 검증 해자는 그대로 사수한다.

4 → ~15 노드

linear → 4개 병렬 영역(solution / verification / test-gen / QA). 신규 노드 다수가 코드(비용 0)이고, 검증·집계는 코드로 처리.

Tiered Trust (A/B/C)

문제별 검증 신뢰 tier 로 출하 게이트. B2B 는 Tier B 이상만 출하, 미달은 reject.

B2B 코테 · B2C 드릴

기업 코딩테스트 출제 중심, 동일 엔진의 canonical 모드가 B2C 토픽 드릴로 파생.

검증 신뢰 tier

마일스톤

v2 토폴로지 전체 + 측정 여정 보기 →

전달 · 연동 Delivery & Integration

v2 그래프가 완성된 뒤, 생성 엔진을 실제 백엔드·서비스에 연결하는 스택을 구축했다 — HTTP API, 공유 PostgreSQL 문제 은행, 난이도 보정, 알고리즘 분류, 공개 검색 번호, 그리고 백엔드 전달 계약(v3.1). 전부 측정 게이트를 통과해 main 에 병합됐고, 계약 문서 3종까지 동기화돼 있다.

📦 문제 은행 prod 스냅샷

난이도 분포 · solved.ac 20티어 보정 (응시자 비노출)

최근 진행

v1.0 마무리(P3 RCA + outputs 영속화 + anchor freeze) → Phase 3 = v2 agentic graph 재공사. RFC 마일스톤 M0~M6 전부 구현 완료 — 검증 성숙(M1) → 병렬 synthesis(M2) → 알고리즘 은닉 모델링(M3) → 풀 채점셋(M4) → QA 4관점 게이트+back-route(M5) → 기법 합성(M6) 모두 main 병합.

PR	제목	타입	임팩트

Infinite Problem Engine