¿Por qué instancias P3 de Amazon EC2?
Las instancias P3 de Amazon EC2 ofrecen informática de alto rendimiento en la nube con hasta 8 GPU NVIDIA® V100 Tensor Core y hasta 100 Gbps de rendimiento de red para el aprendizaje automático y las aplicaciones HPC. Estas instancias ofrecen hasta un petaflop de rendimiento de precisión combinada por instancia para acelerar significativamente el aprendizaje automático y las aplicaciones de informática de alto rendimiento. Se ha probado que las instancias P3 de Amazon EC2 reducen los tiempos de entrenamiento de aprendizaje automático de días a minutos, además de aumentar entre tres y cuatro veces el número de simulaciones completadas para la informática de alto rendimiento.
Con un ancho de banda de red hasta cuatro veces mayor que el de las instancias P3.16xlarge, las instancias P3dn.24xlarge de Amazon EC2 son la última incorporación a la familia P3, optimizada para el machine learning distribuido y las aplicaciones HPC. Estas instancias proporcionan hasta 100 Gbps de rendimiento de redes, 96 vCPU escalables Intel® Xeon® Scalable (Skylake), 8 GPU NVIDIA® V100 Tensor Core con 32 GB de memoria cada una y 1,8 TB de almacenamiento SSD local basado en NVMe. Las instancias P3dn.24xlarge también admiten Elastic Fabric Adapter (EFA) que acelera las aplicaciones de machine learning distribuidas que utilizan la NVIDIA Collective Communications Library, (NCCL). EFA puede escalar a miles de GPU, lo que mejora significativamente el rendimiento y la escalabilidad de los modelos de entrenamiento de aprendizaje profundo, lo que permite obtener resultados más rápidos.
Información general de las instancias P3 de Amazon EC2
Beneficios
Testimonios de clientes
Estos son algunos ejemplos de cómo los clientes y socios lograron sus objetivos empresariales con las instancias P3 de Amazon EC2.
-
Airbnb
Airbnb actualmente utiliza el aprendizaje automático para optimizar las recomendaciones de búsqueda y para mejorar las indicaciones sobre precios dinámicos de los anfitriones, lo que se traduce en un mayor número de reservas concretadas. Con las instancias P3 de Amazon EC2, Airbnb puede ejecutar cargas de trabajo de entrenamiento con mayor rapidez, iterar más, crear mejores modelos de aprendizaje automático y reducir los costos.
-
Celgene
Celgene es una empresa mundial de biotecnología que actualmente desarrolla terapias personalizadas que asocian los tratamientos con los pacientes. La empresa ejecuta sus cargas de trabajo de HPC para secuenciación genómica y simulación química de próxima generación en las instancias P3 de Amazon EC2. Gracias a esta potencia de cómputo, Celgene puede entrenar modelos de aprendizaje profundo para diferenciar células benignas de células malignas. Antes de utilizar las instancias P3, ejecutar trabajos informáticos a gran escala requería dos meses. Ahora, solo se necesitan cuatro horas. La tecnología de AWS permitió que Celgene acelere el desarrollo de terapias con medicamentos para tratar el cáncer y las enfermedades inflamatorias.
-
Hyperconnect
Hyperconnect se especializa en la aplicación de nuevas tecnologías en función del aprendizaje automático para el procesamiento de video e imagen y fue la primera empresa en desarrollar webRTC para plataformas móviles.
-
NerdWallet
NerdWallet es una empresa emergente financiera personal que ofrece herramientas y consejos que facilitan al cliente pagar una deuda, seleccionar los mejores servicios y productos financieros y enfrentar metas importantes, como la compra de una casa o los ahorros para la jubilación. La empresa se basa en gran medida en la ciencia de datos y el aprendizaje automático (ML) a fin de conectar a los clientes con productos financieros personalizados.
-
PathWise Solutions Group
PathWise de Aon, un líder en soluciones de sistemas de calidad, es una aplicación SaaS basada en la nube orientada al modelo de gestión de riesgos empresariales que ofrece velocidad, fiabilidad, seguridad y servicio bajo demanda para una selección de clientes.
-
Pinterest
Pinterest utiliza un entrenamiento de precisión combinado en las instancias P3 de AWS para acelerar el entrenamiento de los modelos de aprendizaje profundo. También utiliza estas instancias para lograr la inferencia de estos modelos con mayor rapidez y permitir una experiencia de detección única y rápida para los usuarios. Pinterest utiliza PinSage, el cual se desarrolló con PyTorch en AWS. Estos grupos de modelos de inteligencia artificial juntan imágenes según determinados temas. Con 3 mil millones de imágenes en la plataforma, existen aproximadamente 18 mil millones de asociaciones diferentes que conectan imágenes. Estas asociaciones ayudan a Pinterest a contextualizar los temas y los estilos. Además, ayudan a crear experiencias más personalizadas para los usuarios.
-
Salesforce
Salesforce utiliza el aprendizaje automático para respaldar Einstein Vision, lo que permite a los desarrolladores aprovechar el poder del reconocimiento de imágenes para casos de uso, como las búsquedas visuales, la detección de marcas y la identificación de productos. Las instancias P3 de Amazon EC2 permiten que los desarrolladores capaciten los modelos de aprendizaje automático mucho más rápido para que puedan alcanzar su objetivos de aprendizaje automático velozmente.
-
Schrodinger
Schrödinger usa la informática de alto rendimiento (HPC) para desarrollar modelos predictivos a los fines de ampliar la escala de descubrimiento y optimización, y así brindar a sus clientes la capacidad de ofrecer medicamentos vitales en el mercado más rápidamente. Las instancias P3 de Amazon EC2 permiten que Schrödinger realice cuatro veces más simulaciones al día que con las instancias P2.
-
Subtle Medical
Subtle Medical es una empresa de tecnología de sanidad que trabaja para mejorar la eficiencia de las imágenes médicas y la experiencia del paciente con soluciones innovadoras de aprendizaje profundo. Su equipo está compuesto por científicos de imágenes, radiólogos y expertos en IA reconocidos de Stanford, MIT y MD Anderson, entre otros.
-
Western Digital
Western Digital usa la informática de alto rendimiento para ejecutar decenas de miles de simulaciones para las ciencias de materiales, los flujos de calor, la magnética y la transferencia de datos, a fin de mejorar la calidad y el rendimiento de las soluciones de almacenamiento y las unidades de disco. Con base en las primeras evaluaciones, las instancias P3 permiten que los equipos de ingeniería ejecuten simulaciones al menos tres veces más rápido que con las soluciones implementadas anteriormente.
Instancias P3 de Amazon EC2 y Amazon SageMaker
Instancias P3 de Amazon EC2 y AMI de aprendizaje profundo de AWS
Entornos de desarrollo preconfigurado para comenzar rápidamente a crear aplicaciones de aprendizaje profundo
Las AMI de aprendizaje profundo de AWS, una alternativa a Amazon SageMaker para los desarrolladores que tienen requisitos más personalizados, ofrecen a los profesionales de machine learning y a los investigadores la infraestructura y las herramientas para agilizar el aprendizaje profundo en la nube a cualquier escala. Puede lanzar rápidamente instancias P3 de Amazon EC2 con marcos de aprendizaje profundo conocidos que se instalaron con anterioridad, como TensorFlow, PyTorch, Apache MXNet, Microsoft Cognitive Toolkit, Caffe, Caffe2, Theano, Torch, Chainer, Gluon y Keras, para entrenar modelos de inteligencia artificial personalizados y sofisticados, probar algoritmos nuevos o aprender nuevas técnicas y habilidades. Más información
Instancias P3 de Amazon EC2 e informática de alto rendimiento
Resuelva problemas informáticos a gran escala y obtenga nueva información con la potencia de HPC en AWS
Las instancias P3 de Amazon EC2 son una plataforma ideal para ejecutar simulaciones de ingeniería, finanza computacional, análisis sísmico, modelado molecular, genómica, representaciones y otras cargas de trabajo informáticas con GPU. La informática de alto rendimiento (HPC) permite a los científicos e ingenieros resolver estos problemas complejos que exigen una gran capacidad informática. Con frecuencia, las aplicaciones de HPC exigen un alto nivel de rendimiento de red, almacenamiento ágil, gran capacidad de memoria, capacidades informáticas altas, o todas estas características juntas. AWS permite agilizar las investigaciones y disminuir los plazos de obtención de resultados mediante la ejecución de HPC en la nube y el escalado de un mayor número de tareas paralelas del que sería posible en la mayoría de los entornos en las instalaciones. Por ejemplo, las instancias P3dn.24xlarge admiten Elastic Fabric Adapter (EFA) que permite que las aplicaciones HPC que utilizan Message Passing Interface (MPI) escalen a miles de GPU. AWS ayuda a reducir costos al ofrecer soluciones optimizadas para las aplicaciones específicas y sin la necesidad de realizar grandes inversiones de capital. Más información
Compatibilidad con NVIDIA RTX Virtual Workstation
Las AMI de NVIDIA RTX Virtual Workstation entregan un alto rendimiento de gráficos por medio de potentes instancias P3 con GPU NVIDIA Volta V100 que se ejecutan en la nube de AWS. Estas AMI tienen el último software de gráficos de las GPU NVIDIA preinstalado junto con los últimos controladores RTX y las certificaciones NVIDIA ISV que admiten hasta cuatro resoluciones de escritorio 4K. Las instancias P3 con GPU NVIDIA V100 combinadas con las RTX vWS entregan una estación de trabajo de alto rendimiento en la nube con hasta 32 GiB de memoria de GPU, rápido trazado de rayos y renderizado con tecnología de IA.
Las nuevas AMI están disponibles en AWS Marketplace y son compatibles con Windows Server 2016 y Windows Server 2019.
Instancias P3dn.24xlarge de Amazon EC2
Detalles de producto de la instancia P3 de Amazon EC2
Tamaño de instancia | GPU – Tesla V100 | GPU de pares | Memoria de GPU (GB) | vCPU | Memoria (GB) | Ancho de banda de la red | Ancho de banda de EBS | Precio de la instancia bajo demanda por hora* | Por hora real en una instancia reservada por 1 año* | Por hora real en una instancia reservada por 3 años.* |
---|---|---|---|---|---|---|---|---|---|---|
p3.2xlarge | 1 | N/D | 16 | 8 | 61 | Hasta 10 Gbps | 1,5 Gbps | 3,06 USD | 1,99 USD | 1,05 USD |
p3.8xlarge | 4 |
NVLink | 64 | 32 | 244 | 10 Gbps | 7 Gbps | 12,24 USD | 7,96 USD | 4,19 USD |
p3.16xlarge | 8 | NVLink | 128 | 64 | 488 | 25 Gbps | 14 Gbps | 24,48 USD | 15,91 USD | 8,39 USD |
p3dn.24xlarge | 8 | NVLink | 256 | 96 | 768 | 100 Gbps | 19 Gbps | 31,218 USD | 18,30 USD | 9,64 USD |
* Los precios mostrados corresponden a Linux/Unix en la región de AWS EE.UU. Este (Norte de Virginia) y se redondean al céntimo más bajo. Para ver la información sobre precios completa, consulte la página de precios de Amazon EC2.
Los clientes pueden adquirir instancias P3 como instancias bajo demanda, instancias reservadas, instancias de spot o hosts dedicados.
Facturación por segundo
Una de las numerosas ventajas de la informática en la nube es la naturaleza elástica del aprovisionamiento o el desaprovisionamiento de recursos, según los requiera. Con la facturación del uso por segundo, los clientes pueden mejorar su elasticidad, ahorrar dinero y optimizar la asignación de los recursos para alcanzar sus objetivos de aprendizaje automático.
Precios de las instancias reservadas
Las instancias reservadas ofrecen un descuento importante (hasta del 75 %) en comparación con los precios de las instancias bajo demanda. Además, cuando se asignan instancias reservadas a una zona de disponibilidad específica, se proporciona una reserva de capacidad, lo que le aporta más tranquilidad en relación con la posibilidad de lanzar instancias cuando las necesite.
Precios de las instancias de spot
Con las instancias de spot, paga el precio de spot vigente durante el periodo en que sus instancias se ejecuten. Amazon EC2 define los precios de las instancias de spot y estos se ajustan gradualmente en función de las tendencias a largo plazo de la oferta y la demanda de capacidad de este tipo de instancia. Las instancias de spot están disponibles con un descuento de hasta el 90 % en comparación con los precios de las instancias bajo demanda.
La más amplia disponibilidad en el mundo
Las instancias P3.2xlarge, P3.8xlarge y P3.16xlarge de Amazon EC2 están disponibles en 14 regiones de AWS para que los clientes tengan la flexibilidad de entrenar e implementar sus modelos de aprendizaje automático donde los datos estén almacenados. Las regiones de AWS disponibles para P3 son EE. UU. Este (Norte de Virginia), EE. UU. Este (Ohio), EE. UU. Oeste (Oregón), Canadá (Central), Europa (Irlanda), Europa (Frankfurt), Europa (Londres), Asia Pacífico (Tokio), Asia Pacífico (Seúl), Asia Pacífico (Sídney), Asia Pacífico (Singapur), China (Pekín), China (Ningxia) y GovCloud (EE. UU.).
Las instancias P3dn.24xlarge están disponibles en las regiones de AWS Asia-Pacífico (Tokio), Europa (Irlanda), Este de EE. UU. (Norte de Virginia), Oeste de EE. UU. (Oregón), GovCloud (EE. UU. Oeste) y GovCloud (EE. UU. Este).
Comience a utilizar las instancias P3 de Amazon EC2 para el aprendizaje automático
Para poder comenzar en minutos, obtenga más información sobre Amazon SageMaker o use la AMI de aprendizaje profundo de AWS, instalada previamente con marcos de aprendizaje profundo conocidos, como Caffe2 y MXNet. Opcionalmente, también puede utilizar la AMI de NVIDIA con un controlador de GPU y un conjunto de herramientas CUDA instalados previamente.