Preguntas frecuentes sobre Amazon SageMaker

Aspectos generales

La próxima generación de SageMaker es una plataforma unificada para datos, análisis e IA. Al combinar las capacidades de análisis y machine learning (ML) de AWS ampliamente adoptadas, la próxima generación de SageMaker ofrece una experiencia integrada de análisis e IA con acceso unificado a todos sus datos. SageMaker le permite una colaboración y creación más rápidas a través de un estudio unificado (versión preliminar) donde se utilizan los servicios de AWS conocidos para el desarrollo de modelos, la IA generativa, el procesamiento de datos y el análisis de SQL que acelera Amazon Q Developer, el asistente de IA generativa más capaz para el desarrollo de software. Además, puede acceder a todos sus datos, ya sea que estén almacenados en lagos de datos, almacenes de datos, u orígenes de datos de terceros o federados, con la gobernanza integrada para abordar las necesidades de seguridad empresarial.

Expandimos el servicio Amazon SageMaker, ampliamente adoptado, con el conjunto integral de capacidades de datos, análisis e inteligencia artificial de AWS para ofrecer una plataforma unificada de datos, análisis e IA. De ahora en adelante, el conjunto actual de capacidades de IA/ML de SageMaker para la organización de datos, la creación, el entrenamiento y despliegue de modelos de IA se denominará Amazon SageMaker AI. Amazon SageMaker AI está integrada en la próxima generación de Amazon SageMaker y también está disponible como un servicio independiente para quienes desean centrarse específicamente en la creación, el entrenamiento y el despliegue de modelos de IA y ML a escala.

La próxima generación de Amazon SageMaker incluye:

  • Amazon SageMaker Unified Studio (vista previa): un entorno de desarrollo único para acceder y utilizar las herramientas y funciones conocidas de los servicios de análisis e IA/ML de AWS diseñados específicamente, como Amazon EMR, AWS Glue, Amazon Athena, Amazon Redshift, Amazon Bedrock y Amazon SageMaker AI
  • Amazon SageMaker Lakehouse: acceso unificado a los datos en los lagos de datos de Amazon S3, Amazon Redshift y orígenes de datos federados y de terceros
  • Gobernanza de datos e IA de Amazon SageMaker: permiten descubrir, gobernar y colaborar con datos e IA de forma segura

La próxima generación de Amazon SageMaker incluye las siguientes capacidades:

  • Amazon SageMaker Unified Studio (versión preliminar): cree con todos sus datos y herramientas de análisis e IA en un único entorno.
  • Amazon SageMaker Lakehouse: unifique los datos en los lagos de datos de Amazon Simple Storage Service (Amazon S3), los almacenes de datos de Amazon Redshift y los orígenes de datos federadas y de terceros con Amazon SageMaker Lakehouse.
  • Gobernanza de datos e IA: descubra, gobierne y colabore de forma segura en datos e IA con Amazon SageMaker Catalog, creado en Amazon DataZone.
  • Desarrollo de modelos: cree, entrene e implemente ML y FM con infraestructuras, herramientas y flujos de trabajo completamente administrados con Amazon SageMaker AI (antes Amazon SageMaker).
  • Desarrollo de aplicaciones de IA generativa: cree y escale aplicaciones de IA generativa con Amazon Bedrock.
  • Análisis de SQL: obtenga información con Amazon Redshift, el motor de SQL más rentable.
  • Procesamiento de datos: analice, prepare e integre datos para el análisis y la IA mediante marcos de código abierto en Amazon Athena, Amazon EMR y AWS Glue.

Amazon SageMaker es una plataforma unificada para datos, análisis e IA. A través de la combinación de las capacidades de análisis y machine learning de AWS ampliamente adoptadas, la próxima generación de SageMaker ofrece una experiencia integrada de análisis e IA con acceso unificado a todos sus datos. Este enfoque unificado lo ayuda a trabajar de manera más eficiente con los datos, aumentar la colaboración entre los equipos y mejorar la productividad general.

Amazon SageMaker le permite hacer los siguiente:

  • Colaborar y crear más rápido con un único entorno de desarrollo de datos e IA, utilizando los servicios de AWS conocidos para el desarrollo de modelos, la IA generativa, el procesamiento de datos y el análisis de SQL.
  • Desarrollar y escalar sus casos de uso de IA con un amplio conjunto de herramientas para entrenar, personalizar e implementar los modelos fundacionales y de machine learning, y crear rápidamente aplicaciones de IA generativa que se adaptan a su empresa.
  • Reducir los silos de datos con un lakehouse abierto para unificar todos los datos en los lagos de datos de Amazon S3, los almacenes de datos de Amazon Redshift y los orígenes de datos federados o de terceros.
  • Satisfacer las necesidades de seguridad de su empresa con una gobernanza de datos integrada e IA para controlar el acceso del usuario correcto a los datos, los modelos de ML, los artefactos de desarrollo de GenAI y la computación correctos, para la finalidad correcta.

Sí. Puede seguir utilizando los servicios individuales de AWS, como Amazon SageMaker AI (anteriormente Amazon SageMaker), Amazon EMR para el procesamiento de macrodatos, AWS Glue y Amazon Redshift para el almacenamiento de datos de forma independiente en función de sus requisitos empresariales específicos. No hay ningún impacto en la forma en que usted utiliza actualmente sus servicios individuales.

Amazon SageMaker ofrece una ventaja adicional al proporcionar una interfaz unificada y fácil de usar que permite el acceso a estos servicios. Este enfoque le permite innovar de manera más eficaz con sus datos, aumentar la colaboración entre los equipos y mejorar la productividad general.

Amazon SageMaker reúne un conjunto completo de servicios de IA y análisis de AWS en Amazon SageMaker Unified Studio (vista previa), gobernanza de datos e IA de Amazon SageMaker y Amazon SageMaker Lakehouse.

Desde Amazon SageMaker Unified Studio, puede acceder a las capacidades de procesamiento de datos, análisis de SQL, machine learning y desarrollo de aplicaciones de IA generativa mediante los servicios de AWS existentes. Para el procesamiento de datos, servicios como Amazon Athena, AWS Glue, Amazon EMR y Amazon Managed Workflows para Apache Airflow analizan, preparan, integran y orquestan fácilmente los datos para el análisis y la IA a cualquier escala. Para el análisis de SQL, Amazon Redshift se integra perfectamente con Amazon SageMaker Lakehouse para proporcionar potentes capacidades de análisis de SQL en sus datos unificados en los almacenes de datos de Redshift y los lagos de datos de Amazon S3. Amazon SageMaker AI (anteriormente denominado Amazon SageMaker) ofrece capacidades de machine learning para crear, entrenar y desplegar modelos fundacionales y de machine learning. Además, puede desarrollar aplicaciones de IA generativa con Amazon Bedrock IDE (vista previa).

La gobernanza de datos e IA de Amazon SageMaker proporciona una gobernanza integral e integrada a través de una experiencia de administración de datos unificada en Amazon SageMaker Catalog, basada en Amazon DataZone, para descubrir, gobernar y colaborar en datos e IA de forma segura.

Amazon SageMaker Lakehouse se basa en varios servicios de catálogo en el catálogo de datos de AWS Glue, AWS Lake Formation y Amazon Redshift para proporcionar un acceso unificado a los datos en los lagos de datos de Amazon S3, los almacenes de datos de Amazon Redshift y los orígenes de datos federados y de terceros.

Además, estos servicios permanecen disponibles como capacidades independientes a través de la Consola de administración de AWS, lo que brinda flexibilidad en función de sus casos de uso. En 2025, mejoraremos la plataforma Amazon SageMaker con más servicios para unificar las experiencias de análisis e IA. Estos incluyen análisis de búsqueda con Amazon OpenSearch Service, inteligencia empresarial con Amazon QuickSight y streaming con la cartera de servicios de streaming de AWS.

Comenzar a usar Amazon SageMaker es sencillo. El primer paso es ir a la consola de administración de Amazon SageMaker Unified Studio (vista previa) para crear un dominio, la entidad organizadora que conectará los activos, usuarios y sus proyectos para la unidad de negocio. En la consola de administración, elija Crear dominio y se le presentarán dos opciones: Configuración rápida y Configuración manual. Seleccione Configuración rápida para comenzar con un conjunto de configuraciones predeterminadas que se pueden personalizar más adelante. Como alternativa, puede elegir la configuración manual, que brinda un control total sobre la configuración a medida que crea su dominio. Una vez creado el dominio, puede navegar hasta Amazon SageMaker Unified Studio (una aplicación web basada en navegador) donde puede usar todos sus datos y herramientas configuradas para el análisis y la IA. Para obtener más información sobre cómo empezar, consulte la documentación de SageMaker.

Las experiencias actuales de desarrollo de datos en servicios de AWS, como Amazon EMR, AWS Glue y Amazon Athena, siguen estando disponibles. Esto significa que todo el código y los recursos existentes que haya creado pueden seguir utilizándose sin interrupciones. Proporcionaremos guiones de actualización fáciles de usar y directrices completas para llevar su base de código existente a la experiencia unificada de SageMaker en el primer trimestre de 2025.

Estamos expandiendo Amazon SageMaker, un servicio de aprendizaje automático ampliamente adoptado, a una plataforma de datos e IA mediante la integración del conjunto completo de herramientas de datos, análisis e IA de AWS que los clientes ya utilizan en la actualidad. También hemos agregado nuevas capacidades a la nueva plataforma SageMaker, como SageMaker Unified Studio (vista previa), SageMaker Lakehouse (GA) y SageMaker Catalog (GA).

La nueva plataforma SageMaker incluye prácticamente todos los componentes que necesita para el análisis de SQL con Amazon Redshift, el procesamiento de datos con Amazon EMR, el desarrollo de modelos de IA con SageMaker AI y el desarrollo de aplicaciones de IA generativa con el nuevo IDE de BedRock (vista previa), todo ello a través de una experiencia de desarrollo integrada en el estudio unificado (vista previa).

Experiencia de producto

Una entidad de proyecto en SageMaker ayuda a los usuarios a organizar su trabajo y a proporcionar un contexto empresarial sobre los trabajos que realizan. Proporciona un espacio de trabajo colaborativo en el que los usuarios pueden colaborar en datos y artefactos, como modelos de ML, cuadernos, consultas, paneles y aplicaciones de IA generativa. Los proyectos están protegidos para que solo puedan acceder a los datos y las herramientas los usuarios que se agreguen explícitamente al proyecto. El proyecto crea funciones de AWS Identity and Access Management (IAM) en función de las capacidades seleccionadas por el proyecto (por ejemplo, un lago de datos) que proporcionan a los usuarios el acceso necesario para realizar su trabajo. Los proyectos también proporcionan aislamiento laboral dentro de la misma cuenta, así como un límite de seguridad (grupos de seguridad y roles de IAM).

Amazon Q Developer es un asistente conversacional de IA generativa integrado a la experiencia de SageMaker, que mejora la productividad durante todo el ciclo de vida del desarrollo. A través de una interfaz de chat, puede utilizar lenguaje natural para hacer preguntas sobre SageMaker, obtener ayuda con el código y explorar recursos como los conjuntos de datos. Al chatear con Amazon Q Developer, utiliza el contexto de la conversación actual para ofrecer orientación personalizada y asistencia automatizada durante toda la experiencia de desarrollo de SageMaker. Amazon Q Developer puede ayudarlo con las discusiones sobre el código, proporcionar finalizaciones de código en línea, generar consultas de SQL, buscar e integrar conjuntos de datos y ofrecer soporte inteligente adaptado a sus necesidades de desarrollo específicas.


Al comprender los matices de su trabajo, Amazon Q Developer ofrece una asistencia específica y adaptada al contexto que agiliza el proceso de desarrollo y mejora la productividad general en el entorno de SageMaker.

SageMaker proporciona un entorno unificado basado en la web que reúne herramientas potentes para flujos de trabajo completos de datos e IA. Los IDE integrados permiten el desarrollo de IA y ML, lo que le permite procesar grandes volúmenes de datos de diversos orígenes mediante marcos y servicios como PySpark, AWS Glue y Amazon EMR.

Para el control de versiones y la gestión de flujos de trabajo, puede publicar en Git y definir los flujos de trabajo mediante Amazon MWAA. El editor de consultas SQL integrado le permite explorar, analizar y visualizar datos, con la capacidad de guardar y compartir consultas más fácilmente y crear nuevos conjuntos de datos.

El desarrollo de modelos se simplifica mediante las conocidas herramientas de IA de SageMaker, como los cuadernos de Amazon SageMaker, JumpStart, HyperPod, MLFlow, Pipelines y Model Registry. A lo largo de estos procesos, Amazon Q Developer se integra perfectamente en todas las herramientas de SageMaker, lo que proporciona asistencia inteligente para el descubrimiento de datos, la preparación, la creación de canalizaciones, la creación y el entrenamiento de modelos y la implementación de código.

El IDE de Bedrock (versión preliminar), integrado en SageMaker Unified Studio (versión preliminar), proporciona un entorno completo para desarrollar aplicaciones de IA generativa. Esta interfaz intuitiva lo ayuda a acelerar el desarrollo de aplicaciones en un entorno confiable y seguro, y ofrece acceso a los modelos fundacionales de alto rendimiento y a las capacidades de personalización avanzadas de Amazon Bedrock.

Puede utilizar características potentes, como las bases de conocimiento de Amazon Bedrock, la barrera de protección, los agentes y los flujos de peticiones, lo que le permite a su equipo adaptar rápidamente las aplicaciones de IA generativa a sus necesidades empresariales específicas y, al mismo tiempo, cumplir con sus directrices de IA responsable. La plataforma admite su acceso gobernado y permite una colaboración interfuncional segura mediante el uso compartido controlado por el acceso y la auditabilidad respaldada por GIT.

Amazon SageMaker Lakehouse unifica los datos en todos los lagos de datos, los almacenes de datos, las aplicaciones de terceros y las bases de datos operativas de AWS. Brinda un acceso rápido y simplificado a los datos en un solo lugar a través de integraciones sin ETL, fuentes de consulta federadas y más de 240 conectores.

Amazon SageMaker proporciona una gobernanza completa e integrada a través de una experiencia de administración de datos unificada en Amazon SageMaker Catalog, basada en Amazon DataZone. Este enfoque le permite catalogar, descubrir, acceder, analizar y gobernar los activos de datos estructurados y no estructurados, los modelos de machine learning y las aplicaciones en toda su organización. La plataforma garantiza que las personas adecuadas tengan el acceso apropiado a los activos correctos, mientras mantiene los estándares sólidos de seguridad y cumplimiento.

Puede crear y administrar canalizaciones de datos en SageMaker de varias maneras. El procesamiento de datos de SageMaker reúne Amazon EMR, Amazon Athena, AWS Glue y Amazon MWAA para ayudarlo a integrar, preparar y explorar sus datos en una experiencia unificada. Puede crear canalizaciones para la orquestación de modelos específicos de ML con SageMaker AI y canalizaciones de datos y flujos de trabajo con Amazon MWAA. También puede usar integraciones sin ETL, que simplifican el movimiento de datos mediante la eliminación los procesos complejos de extracción, transformación y carga (ETL) y permitiendo la replicación directa de datos en todos los servicios. Visite ¿Qué es sin ETL? para obtener más información.

Precios

Cuando utilice Amazon SageMaker, se le cobrará según el modelo de precios por los distintos servicios de AWS a los que se puede acceder a través de Amazon SageMaker. El uso de Amazon SageMaker Unified Studio (versión preliminar), el entorno de desarrollo de datos e IA que proporciona la experiencia integrada en Amazon SageMaker no conlleva ningún costo adicional. Para obtener más información, visite la página de precios de Amazon SageMaker sobre los precios de SageMaker.

El nivel gratuito de SageMaker lo ayuda a empezar rápidamente a innovar con datos e IA sin costo alguno. Consulte los precios de SageMaker para obtener más información.

Disponibilidad

La próxima generación de SageMaker está disponible en las regiones de AWS del Este de EE. UU. (Norte de Virginia), Este de EE. UU. (Ohio), Oeste de EE. UU. (Oregón), Asia Pacífico (Tokio) y Europa (Irlanda). SageMaker Unified Studio y Amazon Bedrock IDE están disponibles en versión preliminar en estas mismas regiones de AWS. Para obtener actualizaciones futuras, consulte la lista de servicios regionales de AWS.

Sí. SageMaker está diseñado para proporcionar el rendimiento y el tiempo de actividad consistentes que exigen las cargas de trabajo de IA y análisis de misión crítica. Como plataforma unificada compuesta por varios componentes de servicio, la disponibilidad del servicio está vinculada al componente de servicio utilizado.

Para obtener información detallada sobre los acuerdos de nivel de servicio (SLA) de cada servicio individual, consulte la documentación del SLA correspondiente. Los SLA le proporcionarán las garantías de tiempo de actividad y los compromisos de fiabilidad específicos para los distintos servicios que conforman la experiencia de SageMaker.

La documentación de los SLA disponibles incluye: