Amazon EC2 P5 인스턴스를 사용해야 하는 이유
NVIDIA H100 Tensor Core GPU로 구동되는 Amazon Elastic Compute Cloud(Amazon EC2) P5 인스턴스와 NVIDIA H200 Tensor Core GPU로 구동되는 P5e 인스턴스는 딥 러닝(DL) 및 고성능 컴퓨팅(HPC) 애플리케이션을 위한 Amazon EC2에서 최고의 성능을 제공합니다. 이전 세대 GPU 기반 EC2 인스턴스 대비 솔루션 구현 시간을 최대 4배 앞당기고 ML 모델 훈련 비용을 최대 40%까지 절감할 수 있습니다. 이러한 인스턴스를 사용하면 솔루션을 더 빠르게 반복하여 시장에 더 빨리 출시할 수 있습니다. P5 및 P5e 인스턴스를 사용하여 점점 복잡해지는 대규모 언어 모델(LLM) 및 가장 까다로운 생성형 인공 지능(AI) 애플리케이션을 지원하는 확산 모델을 훈련하고 배포할 수 있습니다. 이러한 애플리케이션에는 질문 응답, 코드 생성, 비디오 및 이미지 생성, 음성 인식 등이 포함되어 있습니다. 또한 이러한 인스턴스를 사용하여 신약 발견, 지진 분석, 기상 예측, 금융 모델링을 위한 까다로운 HPC 애플리케이션을 대규모로 배포할 수 있습니다.
이러한 성능 개선 사항과 비용 절감을 위해 P5 및 P5e 인스턴스는 이전 세대 GPU 기반 인스턴스 대비 2배 더 뛰어난 CPU 성능, 2배 더 높은 시스템 메모리, 4배 더 많은 로컬 스토리지로 NVIDIA H100 및 H200 Tensor Core GPU를 보완합니다. 2세대 Elastic Fabric Adapter(EFAv2) 기술을 사용하여 최대 3,200Gbps의 네트워킹을 통해 분산 훈련 및 긴밀하게 결합된 HPC 워크로드를 위한 업계 최고의 확장 기능을 제공합니다. 짧은 지연 시간으로 대규모 컴퓨팅을 제공하기 위해 P5 및 P5e 인스턴스를 Amazon EC2 UltraClusters에 배포하여 H100 또는 H200 GPU를 최대 2만 개까지 확장할 수 있습니다. 이러한 인스턴스는 페타비트급 비차단 네트워크와 상호 연결됩니다. EC2 UltraClusters의 P5 및 P5e 인스턴스는 슈퍼컴퓨터와 동등한 성능인 최대 20엑사플롭스의 총 컴퓨팅 성능을 제공할 수 있습니다.
Amazon EC2 P5 인스턴스
이점
기능
고객 추천사
고객과 파트너가 Amazon EC2 P4 인스턴스를 사용하여 비즈니스 목표를 달성한 몇 가지 사례를 소개합니다.
-
Anthropic
Anthropic은 신뢰할 수 있고, 해석할 수 있으며, 조종 가능한 AI 시스템을 구축합니다. 이 시스템은 상업적으로나, 그리고 퍼블릭의 이익을 위하여 가치를 창출할 수 있는 많은 기회를 갖게 될 것입니다.
-
Cohere
언어 AI 분야의 선도적인 선구자인 Cohere는 모든 개발자와 기업이 데이터를 비공개로 안전하게 유지하면서 세계 최고의 자연어 처리(NLP) 기술을 사용하여 놀라운 제품을 만들 수 있도록 지원합니다.
-
Hugging Face
Hugging Face는 좋은 기계 학습의 대중화를 사명으로 삼고 있습니다.
제품 세부 정보
인스턴스 크기 | vCPU | 인스턴스 메모리(TiB) | GPU | GPU 메모리 | 네트워크 대역폭(Gbps) | GPUDirect RDMA | GPU P2P | 인스턴스 스토리지(TB) | EBS 대역폭(Gbps) |
---|---|---|---|---|---|---|---|---|---|
p5.48xlarge | 192 | 2 | H100 8개 | 640GB HBM3 |
3,200Gbps EFA | 예 | 900GB/s NVSwitch | 8 x 3.84 NVMe SSD | 80 |
p5e.48xlarge | 192 | 2 | H200 8개 | 1,128GB HBM3e |
3,200Gbps EFA | 예 | 900GB/s NVSwitch | 8 x 3.84 NVMe SSD | 80 |
ML 사용 사례 시작하기
HPC 사용 사례 시작하기
P5 인스턴스는 엔지니어링 시뮬레이션, 컴퓨팅 금융, 지진 분석, 분자 모델링, 유전체학, 렌더링 및 기타 GPU 기반 HPC 워크로드를 실행하기에 적합한 플랫폼입니다. HPC 애플리케이션에는 뛰어난 네트워크 성능, 빠른 스토리지, 대용량 메모리, 뛰어난 컴퓨팅 성능 또는 위의 모든 성능이 필요할 때가 많습니다. P5 인스턴스는 EFAv2를 지원하므로 메시지 전달 인터페이스(MPI)를 사용하여 수천 개의 GPU로 확장되는 HPC 애플리케이션을 지원할 수 있습니다. AWS Batch 및 AWS ParallelCluster는 HPC 개발 작업에서 분산 HPC 애플리케이션을 빠르게 구축하고 확장하는 데 도움이 됩니다.
자세히 알아보기