인공지능(AI)

CXL 동향 (2026년)

더큰돌 2026. 4. 6. 16:09

CXL(Compute Express Link) 동향을 최신으로 업데이트합니다.

2026년 4월 기준으로, CXL은 2025년을 ’ignition year(점화의 해)’로 삼아 2026년 본격 mainstream으로 진입하고 있으며, 특히 하이퍼스케일러 데이터센터(AWS, Google Cloud, Microsoft Azure, Meta 등)에서 실질적인 움직임이 나타나고 있습니다.

AI 워크로드의 ’memory wall(메모리 벽)’을 해결하기 위한 memory pooling/expansion/disaggregation이 핵심입니다.

1. 전체 CXL 동향 요약 (2025~2026)
• 스펙 진화: 2025년 11월 CXL 4.0 스펙이 공식 릴리스되었습니다. PCIe 7.0급 bandwidth(최대 128GT/s)로 이전 세대 대비 2배 향상, AI 대형 모델(KV cache, context window 확대) 대응 강화.
• 주요 용도:
◦ Type-3 memory expander (DRAM 확장)
Rack-scale memory pooling (CXL switch 활용)
◦ Tiered memory (hot/cold data 분리, compression 내장)
• 시장 성장: CXL 컴포넌트 시장이 2024년 ~5억 달러대에서 2028년까지 160억 달러 규모로 폭발적으로 성장할 전망. Hyperscale + AI DC가 주동력.
• TCO 효과: Hyperscaler들은 CXL memory pooling으로 memory-intensive 워크로드 TCO를 15~20% 절감할 수 있다고 평가 중. DDR5 공급 제약과 가격 상승을 DDR4 재사용으로 우회하는 효과도 큽니다.

2. 하이퍼스케일러 데이터센터에서의 실질적인 움직임 (가장 중요한 부분)
단순 PoC(Proof of Concept)를 넘어 상용 배포(preview/production) 단계로 들어섰습니다.

Microsoft Azure (가장 앞서 있음):
◦ 2025년 11월 산업 최초의 상용 CXL memory deployment를 발표.
Astera Labs의 Leo CXL Smart Memory Controller를 사용한 Azure M-series VM에서 CXL memory expansion을 preview로 제공.
◦ Intel Xeon 6 기반으로 CXL Flat Memory Mode 지원. Memory-intensive 워크로드(특히 AI inference, RAG, KV cache)에 바로 적용 가능.
◦ 이는 “pilot phase 끝, production scale 시작” 신호로 평가받고 있어요.

• Google & Meta (스펙 주도 + 실전 준비):
◦ 2023년부터 OCP(Open Compute Project) Hyperscale Tiered Memory Expander Specification 공동 작성 (Meta: Prakash Chauhan, Google: Brian Morris 등).
◦ 핵심: 비용 최적화된 CXL expander (DDR4 3DPC 지원, hardware compression 내장, cold memory tier).
◦ 목적: 기존 DDR4 재사용, embodied carbon 감소, hyperscale급 대량 배포 용이. 2026년 현재 이 스펙을 기반으로 실제 제품 qualification(적합성 검증)이 진행 중입니다.

• 전반적 Hyperscaler 움직임:
Marvell이 2026년 3월 OFC에서 Structera S 30260 (260-lane CXL switch) 발표 → rack-level memory pooling 전용. Hyperscaler 대상으로 Q3 2026 sampling 시작. 기존 Structera X/A (memory expansion + Arm core 내장)도 이미 hyperscaler들이 DDR5 공급 압박 해소용으로 사용 중.
◦ Penguin Solutions: 2026년 3월 세계 최초 production-ready CXL-based KV cache server 출시 (AI inference 최적).
◦ AWS는 공식 배포 발표는 아직 없지만, CXL Consortium 창립 멤버로서 Graviton/Trainium 등 자체 silicon roadmap에 CXL 지원을 포함하고 있으며, Marvell 솔루션 등을 통해 qualification 중인 것으로 보입니다.

3. 실질성 평가
• 2025년: Pilot + qualification 단계 (Azure가 선도).
• 2026년: Production scaling + rack-scale pooling 본격화 (Marvell switch sampling, CXL 4.0 제품 출시).
• Hyperscaler들은 CXL을 통해 server-centric → fabric-centric 아키텍처로 전환 중. GPU/CPU/XPU 간 공유 메모리가 가능해지면서 AI 클러스터 효율이 크게 올라갈 전망입니다.

요약하자면, 하이퍼스케일러에서 CXL은 더 이상 ‘미래 기술’이 아니라 ‘현재 배포 중인 기술’입니다. 특히 Microsoft Azure가 가장 구체적인 상용 움직임을 보여주고 있고, Google/Meta는 스펙으로 전체 생태계를 이끌고 있습니다.

- 이상 내용은 마벨, 아스테라랩스, 펭귄 등 공급망에 속해 있는 업체들의 2025년 연말 공식 발표를 참고함