💻 엔비디아 — "AI 팩토리, 에너지를 인텔리전스로 변환하는 새로운 산업 인프라"
📌 AI 팩토리란 무엇인가
산업화 시대 발전소가 에너지를 전기로 변환했듯, AI 팩토리는 에너지를 **토큰(Token)**으로 변환
핵심 성과 지표: 초당 토큰 수, 와트당 토큰 수, 토큰당 비용, 가동률
단순 소프트웨어가 아닌 상시 가동되는 실시간 인프라로 정의
📌 아키텍처 — 풀스택 코디자인
컴퓨트·네트워킹·메모리·스토리지·소프트웨어·전력·냉각 전 계층을 통합 최적화
자율 에이전트는 추론·계획·코드 작성·툴 사용·서브에이전트 생성까지 수행
워크로드가 길고 복잡해질수록 레이턴시·처리량·가동률 전 영역에서 동시 최적화 필요
📌 세대별 성능 도약
Blackwell Ultra 기반 AI 팩토리: Hopper 플랫폼 대비 메가와트당 토큰 50배↑, 토큰당 비용 35배↓
Vera Rubin 플랫폼(차세대): LPX 적용으로 와트당 성능 추가 35배↑ 목표
NVIDIA Dynamo 프레임워크: 장문 맥락 추론 및 대규모 인퍼런스 처리량 오케스트레이션
📌 생태계 및 구축 방향
Cisco·Dell·HPE·Lenovo·Supermicro 등 글로벌 시스템 파트너와 협력
NVIDIA DSX 레퍼런스 디자인: 기가와트 규모 AI 팩토리를 최저 토큰 비용으로 구현
Omniverse DSX 블루프린트: 시설·하드웨어·소프트웨어를 디지털 트윈으로 사전 검증
엔비디아 자체적으로도 수백 개의 자율 AI 에이전트를 내부 운영에 활용 중