J-Hub AI 뢄석 리포트

sejm99
2026.04.16 10:30
J-Hub AI 뢄석 리포트

πŸš€ NPU μƒνƒœκ³„μ˜ λ‹€μŒ νŒ¨λŸ¬λ‹€μž„: HBM 기반 κ³ μ„±λŠ₯ μ•„ν‚€ν…μ²˜μ˜ κ°€μ„±λΉ„ μ΅œμ ν™” λ°©μ•ˆ 뢄석 (리벨리온 사둀 쀑심)

μž‘μ„± 주체: J-Hub AI 뢄석 μž‘μ„± 일자: 2024λ…„ Xμ›” X일


[Summary: 핡심 μš”μ•½]

인곡지λŠ₯ μΆ”λ‘ (Inference)용 μ‹ κ²½λ§μ²˜λ¦¬μž₯치(NPU) μŠ€νƒ€νŠΈμ—… 리벨리온이 곡적 및 λ―Όκ°„ 자금으둜 총 6,400μ–΅ 원 규λͺ¨μ˜ 프리IPOλ₯Ό μ„±κ³΅μ μœΌλ‘œ λ§ˆλ¬΄λ¦¬ν•˜λ©°, κΈ°μ—… κ°€μΉ˜ 3.4μ‘° μ›μ΄λΌλŠ” 높은 μ‹œμž₯ 평가λ₯Ό ν™•λ³΄ν–ˆμŠ΅λ‹ˆλ‹€. 이 자금 μœ μΉ˜λŠ” 리벨리온이 ν–₯ν›„ λŒ€κ·œλͺ¨ AI 인프라 μ‹œμž₯ μ§„μž…μ— ν•„μš”ν•œ κ°•λ ₯ν•œ μž¬μ •μ  λ°œνŒμ„ λ§ˆλ ¨ν–ˆμŒμ„ μ˜λ―Έν•©λ‹ˆλ‹€. κ·ΈλŸ¬λ‚˜ λ¦¬λ²¨λ¦¬μ˜¨μ€ κ³ μ„±λŠ₯ κ΅¬ν˜„μ„ μœ„ν•΄ 5μ„ΈλŒ€ HBM3E와 같은 κ³ κ°€μ˜ λ©”λͺ¨λ¦¬ ꡬ쑰λ₯Ό μ±„νƒν•¨μœΌλ‘œμ¨, NPUκ°€ 본래 좔ꡬ해야 ν•  핡심 경쟁 μš”μ†ŒμΈ '가격 경쟁λ ₯(Cost-Effectiveness)' 및 'μ €μ „λ ₯(Low-Power)' λ©΄μ—μ„œ ꡬ쑰적 λ”œλ ˆλ§ˆμ— 직면해 μžˆμŠ΅λ‹ˆλ‹€. 성곡적인 상μž₯ 및 μ‹œμž₯ μ•ˆμ°©μ„ μœ„ν•΄μ„œλŠ” 졜고 μ„±λŠ₯(Peak Performance)을 λ„˜μ–΄μ„ , TCO(Total Cost of Ownership) μΈ‘λ©΄μ—μ„œμ˜ 검증이 ν•„μˆ˜ 과제둜 남아 μžˆμŠ΅λ‹ˆλ‹€.

[Technical Deep Dive: 기술적 μ„ΈλΆ€ 뢄석]

리벨리온의 μ•„ν‚€ν…μ²˜ μ„€κ³„λŠ” κ±°λŒ€ μ–Έμ–΄ λͺ¨λΈ(LLM)을 단일 μΉ©μ—μ„œ μ›ν™œν•˜κ²Œ κ΅¬λ™ν•˜κΈ° μœ„ν•΄ κ·ΉλŒ€ν™”λœ λ©”λͺ¨λ¦¬ λŒ€μ—­ν­(Bandwidth)에 μ΄ˆμ μ„ λ§žμΆ”μ—ˆμŠ΅λ‹ˆλ‹€. μ‚Όμ„±μ „μž 5μ„ΈλŒ€ HBM3E 12단 4개λ₯Ό νƒ‘μž¬ν•˜μ—¬ 4.8TB/s에 λ‹¬ν•˜λŠ” λ©”λͺ¨λ¦¬ λŒ€μ—­ν­μ„ ν™•λ³΄ν•œ 것은, LLM μΆ”λ‘ μ—μ„œ ν•„μˆ˜μ μΈ 높은 데이터 전솑 속도λ₯Ό 보μž₯ν•œλ‹€λŠ” μΈ‘λ©΄μ—μ„œ 기술적 μ„±μ·¨κ°€ λ‹λ³΄μž…λ‹ˆλ‹€. μ΄λŠ” μ„±λŠ₯ μ£Όλ„ν˜•(Performance-Driven) μ„€κ³„μ˜ λŒ€ν‘œμ  μ‚¬λ‘€μž…λ‹ˆλ‹€.

ν•˜μ§€λ§Œ μ—”μ§€λ‹ˆμ–΄λ§ κ΄€μ μ—μ„œ 이 섀계가 μ•ˆκ³  μžˆλŠ” 기술적 λ¦¬μŠ€ν¬λŠ” 'μ „λ ₯ νš¨μœ¨μ„±(Energy Efficiency)'κ³Ό 'λΉ„μš© νš¨μœ¨μ„±(Cost Efficiency)'의 상좩 관계(Trade-off)μž…λ‹ˆλ‹€.

  1. HBM의 μ–‘λ‚ μ˜ κ²€: HBM은 압도적인 λŒ€μ—­ν­μ„ μ œκ³΅ν•˜μ§€λ§Œ, κ·Έ 원가 ꡬ쑰 μžμ²΄κ°€ 맀우 λ†’μŠ΅λ‹ˆλ‹€. NPUλŠ” μ „ν†΅μ μœΌλ‘œ μ €μ „λ ₯, μ €λΉ„μš©μ˜ Edge AI ν™˜κ²½μ— μ΅œμ ν™”λ˜μ–΄ μ™”μœΌλ©°, 이듀 ν™˜κ²½μ—μ„œλŠ” LPDDR D램과 같은 μ €μ „λ ₯ λ©”λͺ¨λ¦¬ 채택이 ꡬ쑰적으둜 μœ λ¦¬ν•©λ‹ˆλ‹€. κ³ κ°€ HBM 채택은 NPU 특유의 'κ°€μ„±λΉ„'λΌλŠ” 정체성을 ν¬μ„μ‹œν‚€λŠ” 근본적인 원인이 될 수 μžˆμŠ΅λ‹ˆλ‹€.
  2. μ°¨μ„ΈλŒ€ μ•„ν‚€ν…μ²˜ μš”κ΅¬: ν–₯ν›„ 리벨리온이 μ‹œμž₯μ—μ„œ μ£Όλ„κΆŒμ„ ν™•λ³΄ν•˜λ €λ©΄, λ‹¨μˆœνžˆ HBM νƒ‘μž¬ 개수λ₯Ό λŠ˜λ¦¬λŠ” κ²ƒλ³΄λ‹€λŠ”, λ©”λͺ¨λ¦¬ μ•„ν‚€ν…μ²˜μ™€ NPU μ½”μ–΄ 섀계λ₯Ό 근본적으둜 λ³‘ν•©ν•˜λŠ” 3D-νŒ¨ν‚€μ§• μ΅œμ ν™” κΈ°μˆ μ΄λ‚˜, νŠΉμ • μ›Œν¬λ‘œλ“œμ— 맞좰 HBM λŒ€μ‹  μ΅œμ ν™”λœ On-chip Memory 계측을 ν™•λ³΄ν•˜λŠ” λ°©μ‹μœΌλ‘œ 섀계 νŒ¨λŸ¬λ‹€μž„μ„ μ „ν™˜ν•˜λŠ” 것이 기술적 κ³Όμ œμž…λ‹ˆλ‹€.

[Market & Industry Impact: μ‚°μ—… 영ν–₯도]

이번 λŒ€κ·œλͺ¨ 자금 쑰달은 리벨리온의 μ‹œμž₯ 신뒰도λ₯Ό λ†’μ˜€μœΌλ‚˜, μ‹€μ œ μ‚°μ—… μ‹œμž₯ μ§„μž… λ‹¨κ³„μ—μ„œλŠ” 고객사 μƒνƒœκ³„(Ecosystem)와 μ‹ λ’°μ„±(Reliability)이 핡심 λ³€μˆ˜λ‘œ μž‘μš©ν•©λ‹ˆλ‹€.

첫째, κ²½μŸμ‚¬ μƒνƒœκ³„μ˜ λ²½: λŒ€ν˜• IT 고객사듀은 이미 κ²€μ¦λœ μ„±λŠ₯κ³Ό μ•ˆμ •μ„±μ„ κ°€μ§„ μ—”λΉ„λ””μ•„(Nvidia) μ€‘μ‹¬μ˜ μƒνƒœκ³„(Blackwell λ“±)에 높은 μ˜μ‘΄λ„λ₯Ό λ³΄μž…λ‹ˆλ‹€. 리벨리온이 아무리 μ €λ ΄ν•œ 가격을 μ œμ‹œν•˜λ”λΌλ„, λ°μ΄ν„°λ² μ΄μŠ€(DB)와 μ‹œμŠ€ν…œ 톡합(SI) κ²½ν—˜μ΄ λΆ€μ‘±ν•œ μ‹ κ·œ NPU에 λŒ€ν•œ κ³ κ°μ‚¬μ˜ 심리적 μž₯λ²½(Switching Cost)을 λ„˜μ–΄μ„œλŠ” 것이 μ΅œλŒ€ κ³Όμ œμž…λ‹ˆλ‹€. λ‘˜μ§Έ, 핡심 κ³ κ°μ‚¬μ˜ μ˜μ‚¬κ²°μ • λ³€ν™”: SKT에 μ•„ν†°λ§₯슀λ₯Ό νƒ‘μž¬ν•˜λ©° 초기 성곡 사둀λ₯Ό λ§Œλ“  것은 κΈμ •μ μ΄λ‚˜, KT μ‚¬λ‘€μ—μ„œ 보듯 고객사듀이 λ‹¨μˆœνžˆ 'κ°€μ„±λΉ„'λΌλŠ” 단일 μ§€ν‘œλ§ŒμœΌλ‘œ 벀더λ₯Ό μ„ νƒν•˜μ§€ μ•ŠμŒμ„ λ³΄μ—¬μ€λ‹ˆλ‹€. 고객듀은 μ„±λŠ₯, μ•ˆμ •μ„±, 운영 μš©μ΄μ„±, 그리고 무엇보닀 '운영 μ‹ λ’°μ„±'을 ν†΅ν•©μ μœΌλ‘œ ν‰κ°€ν•©λ‹ˆλ‹€.

λ”°λΌμ„œ λ¦¬λ²¨λ¦¬μ˜¨μ€ ν™•λ³΄ν•œ μžλ³Έμ„ λ‹¨μˆœνžˆ μ—°κ΅¬κ°œλ°œ(R&D)μ—λ§Œ 집쀑할 것이 μ•„λ‹ˆλΌ, λŒ€κ·œλͺ¨ μ‹œμŠ€ν…œ 톡합 및 μ „λ ₯ 관리(Power Management) μ†”λ£¨μ…˜ 제곡 μ—­λŸ‰ 강화에 νˆ¬μžν•˜μ—¬ 'μ‹œμŠ€ν…œ μ†”λ£¨μ…˜ 제곡자'λ‘œμ„œμ˜ μž…μ§€λ₯Ό λ‹€μ Έμ•Ό ν•©λ‹ˆλ‹€.

[Engineering Perspective: μ—”μ§€λ‹ˆμ–΄λ§ μΈμ‚¬μ΄νŠΈ]

ν˜„μž₯ μ—”μ§€λ‹ˆμ–΄ κ΄€μ μ—μ„œ λ³Ό λ•Œ, 리벨리온의 성곡을 μœ„ν•΄μ„œλŠ” '기술적 μ„±λŠ₯ 증λͺ…'을 λ„˜μ–΄μ„  'μ‹œμŠ€ν…œ μ΅œμ ν™” 증λͺ…'이 ν•„μš”ν•©λ‹ˆλ‹€.

  1. μΈ‘μ • μ§€ν‘œμ˜ μ „ν™˜ (Metric Shift): μ΄μ œλŠ” λ‹¨μˆœν•œ TOPS (Tera Operations Per Second) 같은 피크 μ„±λŠ₯ μ§€ν‘œλ§ŒμœΌλ‘œλŠ” 경쟁 μš°μœ„λ₯Ό ν™•λ³΄ν•˜κΈ° μ–΄λ ΅μŠ΅λ‹ˆλ‹€. λŒ€μ‹ , Performance per Watt (Wλ‹Ή μ„±λŠ₯), 즉 μ—λ„ˆμ§€ νš¨μœ¨μ„±μ„ μ΅œμš°μ„ μœΌλ‘œ ν•˜λŠ” λ©”νŠΈλ¦­μœΌλ‘œ λ§ˆμΌ€νŒ… 및 μ—”μ§€λ‹ˆμ–΄λ§ λ…Έλ ₯을 집쀑해야 ν•©λ‹ˆλ‹€.
  2. μ›Œν¬λ‘œλ“œ νŠΉν™” μ•„ν‚€ν…μ²˜ (Workload-Specific Architecture): LLM 좔둠은 λ‹¨μΌν•œ μ›Œν¬λ‘œλ“œκ°€ μ•„λ‹™λ‹ˆλ‹€. LLM μΆ”λ‘  μ›Œν¬λ‘œλ“œλ₯Ό μ„ΈλΆ„ν™”(예: BERT, 트랜슀포머 인코더/디코더 뢄리)ν•˜κ³ , 각 μ›Œν¬λ‘œλ“œμ— κ°€μž₯ 효율적인 NPU 코어와 λ©”λͺ¨λ¦¬ ꡬ성(HBM vs. LPDDR)을 μœ μ—°ν•˜κ²Œ νƒ‘μž¬ν•  수 μžˆλŠ” 'ν•˜μ΄λΈŒλ¦¬λ“œ μ•„ν‚€ν…μ²˜'λ₯Ό μ„€κ³„ν•˜κ³  이λ₯Ό κ³ κ°μ—κ²Œ μž…μ¦ν•΄μ•Ό ν•©λ‹ˆλ‹€.
  3. νŽŒμ›¨μ–΄ 및 μ†Œν”„νŠΈμ›¨μ–΄ μƒνƒœκ³„ ꡬ좕: 아무리 ν•˜λ“œμ›¨μ–΄ μ„±λŠ₯이 λ›°μ–΄λ‚˜λ„, 이λ₯Ό 효율적으둜 ꡬ동할 수 μžˆλŠ” μ΅œμ ν™”λœ νŽŒμ›¨μ–΄(Firmware)와 컴파일러(Compiler) μ΅œμ ν™”κ°€ λ’€λ”°λ₯΄μ§€ μ•ŠμœΌλ©΄ λ¬΄μš©μ§€λ¬Όμž…λ‹ˆλ‹€. κ΅­λ‚΄ λ°˜λ„μ²΄ λ°Έλ₯˜μ²΄μΈμ˜ μ„ μˆœν™˜μ„ μ΄λ£¨κ² λ‹€λŠ” λΉ„μ „μ²˜λŸΌ, ν•˜λ“œμ›¨μ–΄μ™€ μ†Œν”„νŠΈμ›¨μ–΄ μŠ€νƒ 전체λ₯Ό μ•„μš°λ₯΄λŠ” μ’…ν•© μ—”μ§€λ‹ˆμ–΄λ§ μ†”λ£¨μ…˜μ„ μ™„μ„±ν•˜λŠ” 것이 ν•΅μ‹¬μž…λ‹ˆλ‹€.

#λ°˜λ„μ²΄ #NPU #HBM #AIμΆ”λ‘  #μ‹œμŠ€ν…œμ•„ν‚€ν…μ²˜ #μ§€λŠ₯ν˜•μ†”λ£¨μ…˜