COREPIN · KOREAN SLM STUDIO

한 분야씩 깊게
잘하는 한국어 모델만.
Small Korean models
that go deep.

아무리 큰 LLM도 잘 못 푸는 일이 있어요. 개인정보 가리기, 보안 등급 분류, 유해발화 거르기, 한국 영수증 OCR, 한컴 문서 파싱 같은 일들. Corepin은 한 분야씩 따로 학습한 한국어 모델 7개를 운영해요. Even the biggest LLM struggles with some tasks — PII masking, security grading, harm-speech filtering, Korean receipt OCR, HWP parsing. Corepin runs 7 Korean models, each trained deep on one domain.

시장 신호 · 글로벌Market signal · global

SLM은 2027년 LLM의 3배가 돼요. SLMs will 3× LLM usage by 2027.

Gartner 공식 예측이에요. 다들 LLM 한 모델로 다 풀려고 하다가 결국 부정확·고비용·규제 문제로 도메인별 작은 모델로 돌아오고 있어요. SLM 시장은 연 23.6% 성장 중. 한국은 더 가속도가 있어요 — 개인정보보호법·한국어 글리프 정확도·국내 데이터 보존이 모두 작은 모델을 부르는 구조거든요. A Gartner forecast. Everyone tried to solve every task with one LLM, then ran into accuracy, cost, and regulatory walls — and circles back to small domain models. SLM market grows 23.6% CAGR. Korea accelerates faster: PIPA, Korean-glyph accuracy, and in-country data residency all favor small models.

2027년 SLM 사용량 / LLM 대비SLM usage vs LLM by 2027

Gartner 공식 예측 — 기업의 task-specific AI 사용이 일반 LLM 사용을 추월.Gartner forecast — enterprise task-specific AI overtakes general LLMs.

Gartner · 2025
23.6%
SLM 시장 연평균 성장률 ('25–'34)SLM market CAGR ('25–'34)

전체 LLM 시장보다 빠른 속도. 도메인 자산이 강한 회사가 다 가져가는 구조.Faster than the LLM market itself. Domain-asset-heavy players win.

Research and Markets · 2026
1/20
SLM 추론 비용 / LLM 대비SLM inference cost vs LLM

동일 워크로드에서 LLM API는 월 $5K–50K, SLM 자체 호스팅은 $500–2K. 5–20배 차이.Same workload: $5K–50K/mo on LLM APIs vs $500–2K/mo self-hosted SLM. 5–20× gap.

InfoWorld · Label Your Data · 2026
왜 한국에서 SLM이 더 중요한가.Why SLMs matter more in Korea. ① 개인정보보호법·금융·공공 규정상 민감 데이터를 외부 LLM API로 보내기 어려워요. SLM은 회사 안에서 돌아가요. ② 한국어 글리프(받침·어미 변화·한자어)는 영문 학습 위주 LLM이 약한 영역. ③ 한국 도메인 (HWP 문서, 단청 색 영수증, 정형 보고서)은 한국 데이터로 학습한 모델만 정확해요. ④ 글로벌 LLM 경쟁은 자본·GPU 싸움이지만, 한국 SLM은 한국 데이터·도메인 노하우 싸움이라 우리가 8년 쌓은 자산이 통해요. ① PIPA, finance, and public-sector rules make it hard to send sensitive data to external LLMs. SLMs run inside your boundary. ② Korean glyphs (받침, agglutinative endings, Sino-Korean) are weak spots for English-trained LLMs. ③ Korean domains (HWP documents, Korean receipts, formal reports) need models trained on Korean data. ④ Global LLM competition is about capital and GPUs; Korean SLMs are about Korean data and domain know-how — assets we've built for 8 years.
라이브 모델Live models

한국어 도메인 7개. 각자 1등이에요. Seven Korean domains. Each one ranked first.

M/01
LIVE
개인정보 마스킹PII masking

한국형 개인정보 필터Korean PII Filter

이름·주민번호·계좌·주소·전화·이메일 등 18개 항목 한국어 패턴에 맞춰 정확히 잡아요. 영문 PII 솔루션 대비 위양성 −89%. Catches 18 categories — names, IDs, accounts, addresses, phones, emails — tuned to Korean patterns. 89% fewer false positives than English PII tools.

M/02
LIVE
문서보안 등급Document security grade

한국형 문서보안 필터Korean DLP Screener

대외비·내부용·공개 등급을 자동 분류해요. 금융·국방·공공 표준 등급 체계 학습. 짧은 보안 문구 단독으로도 92.5% 정확. Auto-classifies confidential / internal / public. Trained on finance, defense, and public-sector grade systems. 92.5% on short security strings alone.

M/03
LIVE
유해발화 차단Harm speech moderation

한국형 유해발화 필터Korean Moderation

한국어 욕설·혐오·차별·자해유도 발화를 다축으로 잡아요. 가짜 우회 (한자·받침 변형)도 인식해요. Multi-axis: profanity, hate, discrimination, self-harm prompts. Catches obfuscation (Hanja, vowel swaps) too.

M/04
LIVE
정신건강 신호Mental-health signals

한국형 정신건강 필터Korean Mental Health

10개 축 (자살·우울·불안·강박·식이 등)으로 위험 신호를 감지해요. 챗봇 운영사가 1393으로 정확히 연결할 때 사용해요. 10-axis screening (suicide, depression, anxiety, OCD, eating, etc.). Chatbot operators use it to route to 1393 hotline accurately.

M/06
LIVE
한국어 OCRKorean OCR

한국형 OCR 모델Korean OCR

CORD 한국 영수증 벤치마크에서 Claude Opus의 2배+, Gemini 3 Pro·GPT-5.2 모두 추월. OmniDocBench v1.5 종합 94.62점. 2×+ Claude Opus on CORD Korean receipts, beats Gemini 3 Pro and GPT-5.2. OmniDocBench v1.5 score 94.62.

M/07
LIVE
통합 문서 파서Unified doc parser

한국형 통합 문서 파서Korean Doc Parser

HWP · HWPX · DOCX · XLSX · PPTX · PDF · 이미지 18종을 한 API에. 페이지당 ₩2~3. 정밀 표 모드 옵션. HWP, HWPX, DOCX, XLSX, PPTX, PDF, and images — 18 formats in one API. ₩2–3 per page. Precision-table mode option.

M/0n
진행 중 + 다음 라인In development + next

LLM 하나로 안 풀리는 새 영역이 보일 때마다 라인업에 한 모델씩 추가해요.A new model joins the lineup whenever a Korean-domain task stops working on general LLMs.

한국 법령 해석·의료 차트·교육 평가·산업 안전 검수 — 도메인마다 데이터를 모으고 SFT 사이클을 도는 일이 다른 회사가 쉽게 베끼지 못하는 자산이 돼요. Korean legal interpretation, medical charts, education grading, industrial safety review — gathering domain data and running SFT cycles becomes an asset competitors can't easily copy.

왜 베끼기 어려운가Why it's hard to copy

LLM 경쟁은 자본 싸움.
SLM 경쟁은 데이터·도메인 싸움.
LLM races are capital fights.
SLM races are data and domain fights.

글로벌 LLM은 자본과 GPU만 있으면 누구나 따라잡을 수 있어요. 그런데 한국 SLM은 다른 게임이에요. Anyone with capital and GPUs can chase a frontier LLM. Korean SLMs play a different game.

01

도메인 데이터 쌓는 데 시간이 들어요 Domain data takes years to accumulate

한국 영수증 100만 장, 한국 공공 문서 50만 페이지, 한국어 정신건강 표현 라벨 데이터. 이건 돈만으로는 1년에 못 만들어요. 우리는 8년 모았어요. 1M Korean receipts, 500K Korean public-sector pages, labeled Korean mental-health phrases. Money alone won't buy this in a year. We've been collecting for 8.

02

한국어 평가가 한국에서밖에 안 돼요 Korean evals only work in Korea

CORD 한국 영수증 벤치, K-MHaS, KOLD, OmniDocBench 한국어 파트 — 미국 회사가 이걸 깊이 다루기 어려워요. 우리는 직접 측정하고 직접 학습 데이터로 다시 써요. CORD Korean receipts, K-MHaS, KOLD, OmniDocBench Korean subsets — hard for US shops to engage deeply. We benchmark, then feed the gaps back into training.

03

규제·도메인 전문성이 누적돼요 Regulation and domain knowledge compounds

개인정보보호법·의료법·금융감독원 가이드라인을 모델 안에 내장해 학습해요. 새 회사가 1년 안에 따라잡을 수 없는 컴플라이언스 자산. PIPA, the Medical Law, FSS guidelines — baked into the models. Compliance assets a new entrant can't match in a year.

가격Pricing

호출당 ₩2~10. 쓴 만큼만 내요. ₩2–10 per call. Pay-as-you-go.

PII · DLP · 유해발화Moderation

분류 호출당 ₩5. 배치 ₩2. 무료 티어 일 100호출. Per call: ₩5. Batch ₩2. Free tier: 100/day.

OCR · 통합 문서Doc Parser

페이지당 ₩2~3. 정밀 표 모드 +₩7. 배치 50% 할인. Per page: ₩2–3. Precision-table +₩7. 50% batch discount.

엔터프라이즈Enterprise

월 1억 호출+ · 전용 인스턴스 · 모델 파인튜닝. 견적 문의. 100M+ calls/mo, dedicated instances, fine-tuning. Quote on request.

corepin.ai 둘러보기Visit corepin.ai 엔터프라이즈 견적Enterprise quote