J-Hub AI λΆμ 리ν¬νΈ
π NPU μνκ³μ λ€μ ν¨λ¬λ€μ: HBM κΈ°λ° κ³ μ±λ₯ μν€ν μ²μ κ°μ±λΉ μ΅μ ν λ°©μ λΆμ (λ¦¬λ²¨λ¦¬μ¨ μ¬λ‘ μ€μ¬)
μμ± μ£Όμ²΄: J-Hub AI λΆμ μμ± μΌμ: 2024λ Xμ XμΌ
[Summary: ν΅μ¬ μμ½]
μΈκ³΅μ§λ₯ μΆλ‘ (Inference)μ© μ κ²½λ§μ²λ¦¬μ₯μΉ(NPU) μ€ννΈμ 리벨리μ¨μ΄ 곡μ λ° λ―Όκ° μκΈμΌλ‘ μ΄ 6,400μ΅ μ κ·λͺ¨μ ν리IPOλ₯Ό μ±κ³΅μ μΌλ‘ λ§λ¬΄λ¦¬νλ©°, κΈ°μ κ°μΉ 3.4μ‘° μμ΄λΌλ λμ μμ₯ νκ°λ₯Ό ν보νμ΅λλ€. μ΄ μκΈ μ μΉλ 리벨리μ¨μ΄ ν₯ν λκ·λͺ¨ AI μΈνλΌ μμ₯ μ§μ μ νμν κ°λ ₯ν μ¬μ μ λ°νμ λ§λ ¨νμμ μλ―Έν©λλ€. κ·Έλ¬λ 리벨리μ¨μ κ³ μ±λ₯ ꡬνμ μν΄ 5μΈλ HBM3Eμ κ°μ κ³ κ°μ λ©λͺ¨λ¦¬ ꡬ쑰λ₯Ό μ±νν¨μΌλ‘μ¨, NPUκ° λ³Έλ μΆκ΅¬ν΄μΌ ν ν΅μ¬ κ²½μ μμμΈ 'κ°κ²© κ²½μλ ₯(Cost-Effectiveness)' λ° 'μ μ λ ₯(Low-Power)' λ©΄μμ ꡬ쑰μ λλ λ§μ μ§λ©΄ν΄ μμ΅λλ€. μ±κ³΅μ μΈ μμ₯ λ° μμ₯ μμ°©μ μν΄μλ μ΅κ³ μ±λ₯(Peak Performance)μ λμ΄μ , TCO(Total Cost of Ownership) μΈ‘λ©΄μμμ κ²μ¦μ΄ νμ κ³Όμ λ‘ λ¨μ μμ΅λλ€.
[Technical Deep Dive: κΈ°μ μ μΈλΆ λΆμ]
리벨리μ¨μ μν€ν μ² μ€κ³λ κ±°λ μΈμ΄ λͺ¨λΈ(LLM)μ λ¨μΌ μΉ©μμ μννκ² κ΅¬λνκΈ° μν΄ κ·Ήλνλ λ©λͺ¨λ¦¬ λμν(Bandwidth)μ μ΄μ μ λ§μΆμμ΅λλ€. μΌμ±μ μ 5μΈλ HBM3E 12λ¨ 4κ°λ₯Ό νμ¬νμ¬ 4.8TB/sμ λ¬νλ λ©λͺ¨λ¦¬ λμνμ ν보ν κ²μ, LLM μΆλ‘ μμ νμμ μΈ λμ λ°μ΄ν° μ μ‘ μλλ₯Ό 보μ₯νλ€λ μΈ‘λ©΄μμ κΈ°μ μ μ±μ·¨κ° λ보μ λλ€. μ΄λ μ±λ₯ μ£Όλν(Performance-Driven) μ€κ³μ λνμ μ¬λ‘μ λλ€.
νμ§λ§ μμ§λμ΄λ§ κ΄μ μμ μ΄ μ€κ³κ° μκ³ μλ κΈ°μ μ 리μ€ν¬λ 'μ λ ₯ ν¨μ¨μ±(Energy Efficiency)'κ³Ό 'λΉμ© ν¨μ¨μ±(Cost Efficiency)'μ μμΆ© κ΄κ³(Trade-off)μ λλ€.
- HBMμ μλ μ κ²: HBMμ μλμ μΈ λμνμ μ 곡νμ§λ§, κ·Έ μκ° κ΅¬μ‘° μμ²΄κ° λ§€μ° λμ΅λλ€. NPUλ μ ν΅μ μΌλ‘ μ μ λ ₯, μ λΉμ©μ Edge AI νκ²½μ μ΅μ νλμ΄ μμΌλ©°, μ΄λ€ νκ²½μμλ LPDDR Dλ¨κ³Ό κ°μ μ μ λ ₯ λ©λͺ¨λ¦¬ μ±νμ΄ κ΅¬μ‘°μ μΌλ‘ μ 리ν©λλ€. κ³ κ° HBM μ±νμ NPU νΉμ μ 'κ°μ±λΉ'λΌλ μ 체μ±μ ν¬μμν€λ κ·Όλ³Έμ μΈ μμΈμ΄ λ μ μμ΅λλ€.
- μ°¨μΈλ μν€ν μ² μꡬ: ν₯ν 리벨리μ¨μ΄ μμ₯μμ μ£ΌλκΆμ ν보νλ €λ©΄, λ¨μν HBM νμ¬ κ°μλ₯Ό λ리λ κ²λ³΄λ€λ, λ©λͺ¨λ¦¬ μν€ν μ²μ NPU μ½μ΄ μ€κ³λ₯Ό κ·Όλ³Έμ μΌλ‘ λ³ν©νλ 3D-ν¨ν€μ§ μ΅μ ν κΈ°μ μ΄λ, νΉμ μν¬λ‘λμ λ§μΆ° HBM λμ μ΅μ νλ On-chip Memory κ³μΈ΅μ ν보νλ λ°©μμΌλ‘ μ€κ³ ν¨λ¬λ€μμ μ ννλ κ²μ΄ κΈ°μ μ κ³Όμ μ λλ€.
[Market & Industry Impact: μ°μ μν₯λ]
μ΄λ² λκ·λͺ¨ μκΈ μ‘°λ¬μ 리벨리μ¨μ μμ₯ μ λ’°λλ₯Ό λμμΌλ, μ€μ μ°μ μμ₯ μ§μ λ¨κ³μμλ κ³ κ°μ¬ μνκ³(Ecosystem)μ μ λ’°μ±(Reliability)μ΄ ν΅μ¬ λ³μλ‘ μμ©ν©λλ€.
첫째, κ²½μμ¬ μνκ³μ λ²½: λν IT κ³ κ°μ¬λ€μ μ΄λ―Έ κ²μ¦λ μ±λ₯κ³Ό μμ μ±μ κ°μ§ μλΉλμ(Nvidia) μ€μ¬μ μνκ³(Blackwell λ±)μ λμ μμ‘΄λλ₯Ό 보μ λλ€. 리벨리μ¨μ΄ μ무리 μ λ ΄ν κ°κ²©μ μ μνλλΌλ, λ°μ΄ν°λ² μ΄μ€(DB)μ μμ€ν ν΅ν©(SI) κ²½νμ΄ λΆμ‘±ν μ κ· NPUμ λν κ³ κ°μ¬μ μ¬λ¦¬μ μ₯λ²½(Switching Cost)μ λμ΄μλ κ²μ΄ μ΅λ κ³Όμ μ λλ€. λμ§Έ, ν΅μ¬ κ³ κ°μ¬μ μμ¬κ²°μ λ³ν: SKTμ μν°λ§₯μ€λ₯Ό νμ¬νλ©° μ΄κΈ° μ±κ³΅ μ¬λ‘λ₯Ό λ§λ κ²μ κΈμ μ μ΄λ, KT μ¬λ‘μμ λ³΄λ― κ³ κ°μ¬λ€μ΄ λ¨μν 'κ°μ±λΉ'λΌλ λ¨μΌ μ§νλ§μΌλ‘ λ²€λλ₯Ό μ ννμ§ μμμ 보μ¬μ€λλ€. κ³ κ°λ€μ μ±λ₯, μμ μ±, μ΄μ μ©μ΄μ±, κ·Έλ¦¬κ³ λ¬΄μλ³΄λ€ 'μ΄μ μ λ’°μ±'μ ν΅ν©μ μΌλ‘ νκ°ν©λλ€.
λ°λΌμ 리벨리μ¨μ ν보ν μλ³Έμ λ¨μν μ°κ΅¬κ°λ°(R&D)μλ§ μ§μ€ν κ²μ΄ μλλΌ, λκ·λͺ¨ μμ€ν ν΅ν© λ° μ λ ₯ κ΄λ¦¬(Power Management) μ루μ μ 곡 μλ κ°νμ ν¬μνμ¬ 'μμ€ν μ루μ μ 곡μ'λ‘μμ μ μ§λ₯Ό λ€μ ΈμΌ ν©λλ€.
[Engineering Perspective: μμ§λμ΄λ§ μΈμ¬μ΄νΈ]
νμ₯ μμ§λμ΄ κ΄μ μμ λ³Ό λ, 리벨리μ¨μ μ±κ³΅μ μν΄μλ 'κΈ°μ μ μ±λ₯ μ¦λͺ 'μ λμ΄μ 'μμ€ν μ΅μ ν μ¦λͺ 'μ΄ νμν©λλ€.
- μΈ‘μ μ§νμ μ ν (Metric Shift): μ΄μ λ λ¨μν TOPS (Tera Operations Per Second) κ°μ νΌν¬ μ±λ₯ μ§νλ§μΌλ‘λ κ²½μ μ°μλ₯Ό ν보νκΈ° μ΄λ ΅μ΅λλ€. λμ , Performance per Watt (WλΉ μ±λ₯), μ¦ μλμ§ ν¨μ¨μ±μ μ΅μ°μ μΌλ‘ νλ λ©νΈλ¦μΌλ‘ λ§μΌν λ° μμ§λμ΄λ§ λ Έλ ₯μ μ§μ€ν΄μΌ ν©λλ€.
- μν¬λ‘λ νΉν μν€ν μ² (Workload-Specific Architecture): LLM μΆλ‘ μ λ¨μΌν μν¬λ‘λκ° μλλλ€. LLM μΆλ‘ μν¬λ‘λλ₯Ό μΈλΆν(μ: BERT, νΈλμ€ν¬λ¨Έ μΈμ½λ/λμ½λ λΆλ¦¬)νκ³ , κ° μν¬λ‘λμ κ°μ₯ ν¨μ¨μ μΈ NPU μ½μ΄μ λ©λͺ¨λ¦¬ ꡬμ±(HBM vs. LPDDR)μ μ μ°νκ² νμ¬ν μ μλ 'νμ΄λΈλ¦¬λ μν€ν μ²'λ₯Ό μ€κ³νκ³ μ΄λ₯Ό κ³ κ°μκ² μ μ¦ν΄μΌ ν©λλ€.
- νμ¨μ΄ λ° μννΈμ¨μ΄ μνκ³ κ΅¬μΆ: μ무리 νλμ¨μ΄ μ±λ₯μ΄ λ°μ΄λλ, μ΄λ₯Ό ν¨μ¨μ μΌλ‘ ꡬλν μ μλ μ΅μ νλ νμ¨μ΄(Firmware)μ μ»΄νμΌλ¬(Compiler) μ΅μ νκ° λ€λ°λ₯΄μ§ μμΌλ©΄ 무μ©μ§λ¬Όμ λλ€. κ΅λ΄ λ°λ체 λ°Έλ₯체μΈμ μ μνμ μ΄λ£¨κ² λ€λ λΉμ μ²λΌ, νλμ¨μ΄μ μννΈμ¨μ΄ μ€ν μ 체λ₯Ό μμ°λ₯΄λ μ’ ν© μμ§λμ΄λ§ μ루μ μ μμ±νλ κ²μ΄ ν΅μ¬μ λλ€.
#λ°λ체 #NPU #HBM #AIμΆλ‘ #μμ€ν μν€ν μ² #μ§λ₯νμ루μ