설계(Design)

Tensor Core Architecture (텐서 코어 아키텍처)

대규모 행렬 연산, 특히 딥러닝에서 주로 사용되는 반정밀도(FP16), 8비트 정수(INT8) 등의 저정밀도 행렬 곱셈-누산(Matrix Multiply-Accumulate, MMA) 연산을 매우 효율적으로 수행하도록 설계된 전용 처리 유닛입니다. NVIDIA GPU의 Tensor Core가 대표적인 예시이며, 수천 개의 병렬 연산을 단일 클록 사이클에 처리하여 딥러닝 학습 및 추론 성능을 획기적으로 향상시킵니다. 시스톨릭 배열과 유사한 개념을 포함할 수 있습니다.

최종 업데이트: 2026.04.04

분야별 의견 및 추가 지식

0

의견을 남기려면 로그인이 필요합니다.

로그인
아직 의견이 없습니다. 첫 번째 전문가의견을 남겨보세요!