▒

PJW48의 각종 기록 블로그

제목:

주요 AI 가속기 목록

날짜: 2026-06-16 / 2026-06-16

AI 가속기는 인공지능 모델의 학습(Training)과 추론(Inference)을 가속화하기 위해 설계된 특수 하드웨어입니다. 주요 AI 가속기 시장은 크게 GPU, NPU(ASIC), FPGA로 나뉩니다.

분야별 주요 AI 가속기 목록은 다음과 같습니다.

1. GPU (Graphics Processing Unit) – 시장 주도

현재 AI 학습 및 거대 언어 모델(LLM) 시장을 압도적으로 지배하고 있습니다.

NVIDIA (시장 점유율 1위):
- H100 / H200: 현재 AI 학습의 표준. 높은 연산 성능과 메모리 대역폭.
- B100 / B200 (Blackwell): 차세대 AI 가속기. H100 대비 압도적인 추론 및 학습 성능.
- A100: 이전 세대이지만 여전히 현장에서 많이 사용됨.
AMD:
- Instinct MI300X: NVIDIA의 강력한 경쟁자. 메모리 용량이 커서 대규모 LLM 처리에 강점.

2. NPU 및 ASIC (Application-Specific Integrated Circuit)

특정 AI 작업(주로 추론)에 최적화하여 전력 효율과 비용을 극대화한 칩입니다.

Google:
- TPU (Tensor Processing Unit): 구글의 데이터센터 및 클라우드(GCP)에서 사용되는 독자적인 AI 가속기 (현재 v5p 등).
Amazon (AWS):
- Inferentia: AI 추론 전용 칩.
- Trainium: AI 학습 전용 칩.
Microsoft:
- Maia 100: 애저(Azure) 데이터센터용 자체 AI 칩.
Meta:
- MTIA (Meta Training and Inference Accelerator): 페이스북/인스타그램 알고리즘 최적화를 위한 자체 칩.
Tesla:
- Dojo D1: 자율주행 데이터 학습을 위한 테슬라 독자 칩.

3. 스타트업 및 특화형 가속기

특정 분야나 효율성에 집중한 칩들입니다.

Groq: LPU(Language Processing Unit)라는 독자적인 아키텍처를 사용하여 추론 속도(Latency)가 매우 빠름.
Cerebras: Wafer-Scale Engine (WSE-3). 웨이퍼 한 장 크기의 거대한 칩으로, 엄청난 메모리 대역폭을 제공.
SambaNova: LLM 학습 및 추론에 최적화된 재구성 가능한 데이터 흐름 엔진.

4. 국내 기업 (대한민국)

한국 기업들은 주로 저전력 추론용 NPU에 강점이 있습니다.

SAPEON (사피온): SK텔레콤에서 분사. AI 추론용 NPU.
FuriosaAI (퓨리오사AI): 고성능 AI 추론 칩 (Warboy 등).
Rebellions (리벨리온): 서버용 AI 가속기 (ATOM 등).
DeepX (딥엑스): 엣지 AI(로봇, 가전 등)용 저전력 NPU.

5. 기타 (FPGA)

소프트웨어처럼 설계를 변경할 수 있어 유연성이 높지만, 대규모 학습에는 GPU보다 효율이 떨어집니다.

Intel (Altera): Stratix, Agilex 시리즈.
AMD (Xilinx): Versal ACAP 시리즈.

요약 및 요점

학습(Training): NVIDIA의 H100/B200과 같은 고성능 GPU가 시장을 독점하고 있습니다.
추론(Inference): 비용 절감과 전력 효율을 위해 구글 TPU, AWS Inferentia 같은 ASIC/NPU로 전환되는 추세입니다.
최근 트렌드: 범용적인 연산뿐만 아니라, LLM 처리를 위한 메모리 대역폭(HBM)의 중요성이 매우 커졌습니다.

어떤 용도(데이터센터 학습용, 에지 디바이스 추론용 등)로 가속기를 찾으시는지 알려주시면 더 자세히 설명해 드릴 수 있습니다.

답글 남기기 응답 취소

▲