아무리 큰 LLM도 잘 못 푸는 일이 있어요. 개인정보 가리기, 보안 등급 분류, 유해발화 거르기, 한국 영수증 OCR, 한컴 문서 파싱 같은 일들. Corepin은 한 분야씩 따로 학습한 한국어 모델 7개를 운영해요. Even the biggest LLM struggles with some tasks — PII masking, security grading, harm-speech filtering, Korean receipt OCR, HWP parsing. Corepin runs 7 Korean models, each trained deep on one domain.
Gartner 공식 예측이에요. 다들 LLM 한 모델로 다 풀려고 하다가 결국 부정확·고비용·규제 문제로 도메인별 작은 모델로 돌아오고 있어요. SLM 시장은 연 23.6% 성장 중. 한국은 더 가속도가 있어요 — 개인정보보호법·한국어 글리프 정확도·국내 데이터 보존이 모두 작은 모델을 부르는 구조거든요. A Gartner forecast. Everyone tried to solve every task with one LLM, then ran into accuracy, cost, and regulatory walls — and circles back to small domain models. SLM market grows 23.6% CAGR. Korea accelerates faster: PIPA, Korean-glyph accuracy, and in-country data residency all favor small models.
Gartner 공식 예측 — 기업의 task-specific AI 사용이 일반 LLM 사용을 추월.Gartner forecast — enterprise task-specific AI overtakes general LLMs.
전체 LLM 시장보다 빠른 속도. 도메인 자산이 강한 회사가 다 가져가는 구조.Faster than the LLM market itself. Domain-asset-heavy players win.
동일 워크로드에서 LLM API는 월 $5K–50K, SLM 자체 호스팅은 $500–2K. 5–20배 차이.Same workload: $5K–50K/mo on LLM APIs vs $500–2K/mo self-hosted SLM. 5–20× gap.
이름·주민번호·계좌·주소·전화·이메일 등 18개 항목 한국어 패턴에 맞춰 정확히 잡아요. 영문 PII 솔루션 대비 위양성 −89%. Catches 18 categories — names, IDs, accounts, addresses, phones, emails — tuned to Korean patterns. 89% fewer false positives than English PII tools.
대외비·내부용·공개 등급을 자동 분류해요. 금융·국방·공공 표준 등급 체계 학습. 짧은 보안 문구 단독으로도 92.5% 정확. Auto-classifies confidential / internal / public. Trained on finance, defense, and public-sector grade systems. 92.5% on short security strings alone.
한국어 욕설·혐오·차별·자해유도 발화를 다축으로 잡아요. 가짜 우회 (한자·받침 변형)도 인식해요. Multi-axis: profanity, hate, discrimination, self-harm prompts. Catches obfuscation (Hanja, vowel swaps) too.
10개 축 (자살·우울·불안·강박·식이 등)으로 위험 신호를 감지해요. 챗봇 운영사가 1393으로 정확히 연결할 때 사용해요. 10-axis screening (suicide, depression, anxiety, OCD, eating, etc.). Chatbot operators use it to route to 1393 hotline accurately.
CORD 한국 영수증 벤치마크에서 Claude Opus의 2배+, Gemini 3 Pro·GPT-5.2 모두 추월. OmniDocBench v1.5 종합 94.62점. 2×+ Claude Opus on CORD Korean receipts, beats Gemini 3 Pro and GPT-5.2. OmniDocBench v1.5 score 94.62.
HWP · HWPX · DOCX · XLSX · PPTX · PDF · 이미지 18종을 한 API에. 페이지당 ₩2~3. 정밀 표 모드 옵션. HWP, HWPX, DOCX, XLSX, PPTX, PDF, and images — 18 formats in one API. ₩2–3 per page. Precision-table mode option.
한국 법령 해석·의료 차트·교육 평가·산업 안전 검수 — 도메인마다 데이터를 모으고 SFT 사이클을 도는 일이 다른 회사가 쉽게 베끼지 못하는 자산이 돼요. Korean legal interpretation, medical charts, education grading, industrial safety review — gathering domain data and running SFT cycles becomes an asset competitors can't easily copy.
글로벌 LLM은 자본과 GPU만 있으면 누구나 따라잡을 수 있어요. 그런데 한국 SLM은 다른 게임이에요. Anyone with capital and GPUs can chase a frontier LLM. Korean SLMs play a different game.
한국 영수증 100만 장, 한국 공공 문서 50만 페이지, 한국어 정신건강 표현 라벨 데이터. 이건 돈만으로는 1년에 못 만들어요. 우리는 8년 모았어요. 1M Korean receipts, 500K Korean public-sector pages, labeled Korean mental-health phrases. Money alone won't buy this in a year. We've been collecting for 8.
CORD 한국 영수증 벤치, K-MHaS, KOLD, OmniDocBench 한국어 파트 — 미국 회사가 이걸 깊이 다루기 어려워요. 우리는 직접 측정하고 직접 학습 데이터로 다시 써요. CORD Korean receipts, K-MHaS, KOLD, OmniDocBench Korean subsets — hard for US shops to engage deeply. We benchmark, then feed the gaps back into training.
개인정보보호법·의료법·금융감독원 가이드라인을 모델 안에 내장해 학습해요. 새 회사가 1년 안에 따라잡을 수 없는 컴플라이언스 자산. PIPA, the Medical Law, FSS guidelines — baked into the models. Compliance assets a new entrant can't match in a year.
분류 호출당 ₩5. 배치 ₩2. 무료 티어 일 100호출. Per call: ₩5. Batch ₩2. Free tier: 100/day.
페이지당 ₩2~3. 정밀 표 모드 +₩7. 배치 50% 할인. Per page: ₩2–3. Precision-table +₩7. 50% batch discount.
월 1억 호출+ · 전용 인스턴스 · 모델 파인튜닝. 견적 문의. 100M+ calls/mo, dedicated instances, fine-tuning. Quote on request.