Por que usar as instâncias P5 do Amazon EC2?
As instâncias P5 do Amazon Elastic Compute Cloud (Amazon EC2), equipadas com GPUs NVIDIA H100 Tensor Core, e instâncias P5e com tecnologia de GPUs NVIDIA H200 Tensor Core oferecem a mais alta performance no Amazon EC2 para aplicações de aprendizado profundo (DL) e computação de alta performance (HPC). Elas ajudam você a acelerar o tempo de solução em até quatro vezes em comparação às instâncias do EC2 baseadas em GPU da geração anterior, e a reduzir o custo de treinar modelos de machine learning em até 40%. Essas instâncias ajudam você a iterar suas soluções em um ritmo mais rápido e a chegar ao mercado com mais rapidez. Você pode usar instâncias P5 e P5e para treinar e implantar grandes modelos de linguagem (LLMs) e modelos de difusão cada vez mais complexos que alimentam as aplicações de inteligência artificial (IA) generativa mais exigentes. Essas aplicações incluem respostas a perguntas, geração de código, geração de vídeo e imagem e reconhecimento de fala. Você também pode usar essas instâncias para implantar aplicações de HPC exigentes em grande escala para descoberta farmacêutica, análise sísmica, previsão do tempo e modelagem financeira.
Para oferecer essas melhorias de desempenho e economia de custos, as instâncias P5 e P5e complementam as GPUs NVIDIA H100 e H200 Tensor Core com 2x mais peformance de CPU, 2x mais memória de sistema e 4x mais armazenamento local em comparação com instâncias baseadas em GPU da geração anterior. Elas fornecem recursos de aumento da escala horizontal líderes de mercado para treinamento distribuído e workloads de HPC altamente acopladas com até 3.200 Gbps de rede usando a tecnologia Elastic Fabric Adapter (EFAv2) de segunda geração. Para oferecer computação em grande escala com baixa latência, as instâncias P5 e P5e são implantadas nos Amazon EC2 UltraClusters que permitem escalar até 20.000 GPUs H100 ou H200. Eles estão interconectados com uma rede sem bloqueio em escala de petabytes. As instâncias P5 e P5e nos UltraClusters do EC2 podem oferecer até 20 exaflops de capacidade computacional agregada: uma performance equivalente ao de um supercomputador.
Instâncias P5 do Amazon EC2
Benefícios
Recursos
Depoimentos de clientes
Aqui estão alguns exemplos de como clientes e parceiros alcançaram suas metas de negócios com as instâncias P4 do Amazon EC2.
-
Anthropic
A Anthropic cria sistemas de IA confiáveis, interpretáveis e orientáveis que terão muitas oportunidades de criar valor comercialmente e para benefício público.
-
Cohere
A Cohere, pioneira em IA de linguagem, capacita todos os desenvolvedores e empresas a criarem produtos incríveis com a tecnologia líder mundial de processamento de linguagem natural (PNL), mantendo seus dados privados e seguros
-
Hugging Face
A Hugging Face tem a missão de democratizar a boa ML.
Detalhes do produto
Tamanho da instância | vCPUs | Memória da instância (TiB) | GPU | Memória de GPU | Largura de banda de rede (Gbps) | RDMA GPUDirect | GPU ponto a ponto | Armazenamento de instâncias (TB) | Largura de banda do EBS (Gbps) |
---|---|---|---|---|---|---|---|---|---|
p5.48xlarge | 192 | 2 | 8 H100 | 640 GB HBM3 |
EFA de 3200 Gbps | Sim | NVSwitch de 900 GB/s | 8 x 3.84 SSD NVMe | 80 |
p5e.48xlarge | 192 | 2 | 8 H200 | 1.128 GB HBM3e |
EFA de 3.200 Gbps | Sim | NVSwitch de 900 GB/s | 8 x 3.84 SSD NVMe | 80 |
Primeiros passos com casos de uso de ML
Primeiros passos com casos de uso de HPC
As instâncias P5 formam uma plataforma ideal para executar simulações de engenharia, finanças computacionais, análise sísmica, modelagem molecular, genômica, renderização e outras workloads de HPC baseadas em GPUs. Geralmente, as aplicações de HPC exigem redes de alta performance, armazenamento rápido, grandes quantidades de memória, recursos elevados de computação ou todos esses itens. As instâncias P5 oferecem suporte EFAv2, possibilitando que aplicações de HPC usem a Message Passing Interface (MPI) para escalar milhares de GPUs. O AWS Batch e o AWS ParallelCluster ajudam desenvolvedores de HPC a desenvolver e escalar rapidamente as aplicações de HPC distribuídas.
Saiba mais