Onpod 엔지니어링Engineering

"AI로 개발했는데 어떻게 띄우죠?"에 대한 답. Answering "I built it with AI — now how do I ship it?"

Claude Code로 5분에 만든 앱이 배포에는 5일 걸리는 시대를 끝내고 싶었어요. 한 줄 명령에 서버·GPU·DB가 한국 데이터센터에 뜨도록 설계한 결정들. An app built in 5 minutes with Claude Code shouldn't take 5 days to deploy. Design decisions behind bringing server, GPU, and DB up in one command — in a Korean data center.

2024년 말부터 우리 팀에 흥미로운 패턴이 보였어요. Claude Code·Codex로 prototype을 1시간에 만드는 사람들이 늘었는데, 그 prototype을 prod로 띄우는 데에는 여전히 며칠이 걸렸어요. 서버 빌리고, 도메인 붙이고, TLS 인증서 받고, DB 깔고, 환경 변수 세팅하고, 헬스체크 만들고...

그게 좀 이상하지 않나요. AI가 코드를 1시간에 만들어주는데, 사람이 배포에 5일 걸리는 거. Onpod의 시작 질문은 이거였어요. "AI에게 자연어 한 문장으로 인프라를 띄우게 할 수 있을까?"

설계 결정 1 · 명령을 한 줄로

RunPod도, AWS도, GCP도 인프라 명령이 결국 여러 줄이에요. 우리는 모든 명령을 한 줄로 줄였어요.

onpod app deploy --shape autoscale

이 한 줄에 detect framework → build image → allocate pod → wire DNS → TLS → health check 까지 다 들어가요. 평균 3분 42초에 공개 URL이 떠요.

설계 결정 2 · AI 에이전트가 직접 운영

매뉴얼과 MCP 서버를 분리해서 발행했어요. Claude Code·Cursor·Codex가 onpod manual을 한 번 호출하면 모든 명령·옵션·실수 사례가 자동으로 컨텍스트에 들어가요. AI 에이전트가 직접 인프라를 책임지고 운영해도 사고가 거의 없어요.

설계 결정 3 · 한국 데이터센터 단독

가장 큰 차별점이에요. 글로벌 GPU 클라우드 (RunPod, CoreWeave)는 한국 리전이 없거나, 있어도 결국 미국·일본 데이터센터로 백홀해요. Onpod은 NHN 클라우드 한국 리전에서 직접 운영해요. 사용자 데이터·모델 가중치·체크포인트 모두 국내에서.

이게 단순한 "지리적 위치" 문제가 아니에요. 개인정보보호법·금융감독원 가이드라인이 명확히 국내 보존을 요구하는데, 글로벌 클라우드의 "리전"으로는 그걸 진짜 못 지켜요. Onpod이 한국 리전 단독을 약속한 이유.

설계 결정 4 · 원화 후불

외산 클라우드 청구서를 받아본 한국 회계팀이라면 알 거예요. 매월 환율·세금계산서·VAT 처리에 시간이 빠져요. Onpod은 원화 후불 + 세금계산서 자동 발급. 카드·계좌·간편결제 모두 지원.

지금 보이는 패턴

Onpod 사용자의 60% 이상이 첫 명령을 AI 에이전트가 대신 입력하고 있어요. 사용자가 "다음 주 화요일 데모용 데모 서버 띄워줘" 라고 Claude Code에게 말하면, Claude가 알아서 적절한 shape를 고르고 명령을 실행해요.

이게 우리가 본 미래예요. 사람이 직접 인프라를 만지지 않는 시대. 사람은 일에 집중하고, AI가 인프라를 책임지는 구조. Onpod은 그 구조의 한국형 backbone이 되려고 해요.

From late 2024 we noticed an interesting pattern. People were prototyping apps in an hour with Claude Code, then spending days deploying them. Provisioning servers, attaching domains, getting TLS certs, setting up DBs, env vars, health checks…

That's odd, right? AI writes the code in an hour, the human spends 5 days on deployment. The founding question of Onpod was: "Can we let AI bring up infrastructure with one natural-language sentence?"

Design 1 — One-line commands

RunPod, AWS, GCP — infra commands end up being many lines. We collapsed everything to one.

onpod app deploy --shape autoscale

That one line covers detect framework, build image, allocate pod, wire DNS, TLS, health check. Average time to a public URL: 3 minutes 42 seconds.

Design 2 — Agents operate it directly

We split the manual and the MCP server. One call to onpod manual from Claude Code, Cursor, or Codex pulls every command, option, and known mistake into context. AI agents can own infra with virtually no incidents.

Design 3 — Korea-region only

The biggest differentiator. Global GPU clouds (RunPod, CoreWeave) either lack a Korean region or backhaul to US/Japan. Onpod runs natively on NHN Cloud Korea — user data, model weights, checkpoints all in-country.

This isn't just geography. PIPA and FSS guidelines require in-country residency, and "global cloud with a KR region" can't really guarantee it. Hence the promise.

Design 4 — KRW postpaid

Any Korean finance team that's processed a foreign-cloud invoice knows the time sink: FX, tax invoices, VAT. Onpod bills in KRW postpaid with auto-issued 세금계산서. Card, bank, simple-pay all supported.

The pattern we see now

60%+ of Onpod users have their first command entered by an AI agent. "Bring up a demo server for next Tuesday" to Claude Code, Claude picks the shape and executes.

This is the future we're seeing — humans not touching infrastructure directly, focusing on work while AI owns the infra. Onpod intends to be the Korean backbone of that pattern.

관련 글Related

회사Company

8년 동안 만든 30가지 제품30 products in 8 years

메모리허브

메모리허브가 mem0를 한국에서 이기는 이유Why MemoryHub wins in Korea