Amazon SageMaker Lakehouse

Simplificar el análisis y la IA con un almacén de lago de datos unificado, abierto y seguro

¿Qué es SageMaker Lakehouse?

Amazon SageMaker Lakehouse unifica todos los datos en los lagos de datos de Amazon Simple Storage Service (Amazon S3) y los almacenes de datos de Amazon Redshift, lo que ayuda a crear potentes aplicaciones de análisis e IA/ML en una sola copia de los datos. SageMaker Lakehouse brinda la flexibilidad de acceder a los datos y consultarlos in situ con todas las herramientas y los motores compatibles con Apache Iceberg. Proteja sus datos en un depósito mediante la definición de permisos detallados que se aplican en todas las herramientas y los motores de análisis y machine learning (ML). Lleve los datos de las bases de datos y aplicaciones operativas a lakehouse casi en tiempo real mediante integraciones sin ETL. Además, acceda y consulte los datos en el lugar con capacidades de consulta federadas en orígenes de datos de terceros.

Beneficios

Unifique todos sus datos en los lagos de datos de Amazon S3 y los almacenes de datos de Amazon Redshift con SageMaker Lakehouse. Reúna sus datos de bases de datos y aplicaciones operativas en el lakehouse casi en tiempo real mediante integraciones sin ETL. Puede usar cientos de conectores para integrar datos de varias fuentes. Además, puede acceder a los datos y consultarlos en el lugar con las capacidades de consulta federadas en los orígenes de datos de terceros.
Obtenga la flexibilidad de acceder a sus datos y consultarlos en el lugar con todas las herramientas compatibles con Apache Iceberg en una sola copia de los datos. Puede utilizar las herramientas y los motores de análisis que prefiera, como SQL, Apache Spark, inteligencia empresarial (BI) y herramientas de IA y ML, y colaborar con los datos guardados en los almacenes de datos de Amazon Redshift y los lagos de datos de Amazon S3. Use SageMaker Lakehouse con su arquitectura de datos existente, permitiéndole usar sus formatos de almacenamiento y motores de consulta preferidos, compatibles con Apache Iceberg.
Proteja sus datos con controles de acceso detallados e integrados que se aplican a todos sus datos en todas las herramientas y motores de análisis. Defina los permisos una vez y comparta datos con confianza en toda su organización.

Casos de uso

Unifique todos sus datos en los lagos de datos de Amazon S3 y los almacenes de datos de Amazon Redshift para sus iniciativas de análisis e IA con una sola copia de los datos. Con los controles de acceso integrados, SageMaker Lakehouse permite definir permisos detallados y compartir de forma segura una única copia de los datos en toda la organización.
Acceda a datos casi en tiempo real en las bases de datos y aplicaciones operativas de SageMaker Lakehouse mediante integraciones sin ETL. Acceda a sus datos y consúltelos en el lugar, desde una amplia gama de servicios de AWS y herramientas y motores de código abierto y de terceros compatibles con Apache Iceberg.
Reúna los datos existentes de varios almacenes de datos de Amazon Redshift en SageMaker Lakehouse para consultar y unir los datos almacenados en grupos de trabajo y clústeres de Redshift. Amplíe sus cargas de trabajo para los procesos de extracción, transformación y carga (ETL), los informes de BI y el análisis según sea necesario sin administrar varios recursos compartidos de datos.