Precios de Amazon SageMaker Lakehouse

Amazon SageMaker Lakehouse unifica todos los datos en los lagos de datos de Amazon Simple Storage Service (Amazon S3) y los almacenes de datos de Amazon Redshift, lo que ayuda a crear potentes aplicaciones de análisis e IA/ML en una sola copia de los datos. SageMaker Lakehouse brinda la flexibilidad de acceder a los datos y consultarlos con todas las herramientas y motores compatibles con Apache Iceberg. Puede proteger sus datos en un depósito mediante la definición de permisos detallados, que se aplican de forma coherente en todas las herramientas y motores de análisis y machine learning (ML). Además de estos beneficios, acceda a sus datos desde bases de datos y aplicaciones operativas a través de integraciones sin ETL y a datos de fuentes de terceros a través de capacidades de consulta federadas en el lago de datos.

Se puede acceder directamente a SageMaker Lakehouse desde Amazon SageMaker Unified Studio (vista previa). Los datos de diferentes orígenes se organizan en contenedores lógicos denominados catálogos en SageMaker Lakehouse. Cada catálogo representa datos de fuentes de datos existentes, como almacenes de datos y bases de datos de terceros, o creados directamente en el lago de datos para almacenar datos en Amazon S3 o Amazon Redshift Managed Storage (RMS). Los motores de consulta pueden conectarse a estos catálogos y acceder a los datos in situ con las API de Apache Iceberg. Puede usar cualquier motor compatible con Apache Iceberg, como Apache Spark, Trino, Amazon Athena o Amazon EMR, para acceder a los datos como tablas de Apache Iceberg y consultarlos desde sus motores de consulta propios y de terceros. Del mismo modo, los catálogos se montan en motores de consulta propios, como clústeres y grupos de trabajo de Amazon Redshift, como bases de datos. Conéctese a las bases de datos desde las herramientas de consulta a través de Java Database Connectivity (JDBC) o Amazon Redshift Query Editor V2 para realizar consultas con SQL.

Precios de SageMaker Lakehouse

SageMaker Lakehouse tiene los siguientes componentes subyacentes. Usted paga por los componentes que usa en el lago de datos.

Metadatos de SageMaker Lakehouse: las definiciones de datos se organizan en una jerarquía lógica de catálogos, bases de datos y tablas mediante el catálogo de datos de AWS Glue.

  • Catálogo: contenedor lógico que contiene objetos de un almacén de datos, como esquemas, tablas, vistas o vistas materializadas de Amazon Redshift. Puede anidar catálogos en un catálogo para que coincidan con los niveles de jerarquías de la fuente de datos que está trayendo al lakehouse.
  • Base de datos: las bases de datos se pueden utilizar para organizar los objetos de datos, como tablas y vistas, en el lakehouse.
  • Tablas y vistas: las tablas y las vistas son objetos de datos en una base de datos que describen cómo acceder a los datos subyacentes, como el esquema, las particiones, la ubicación de almacenamiento, el formato de almacenamiento y la consulta SQL para acceder a los datos.

Se puede acceder a los metadatos de SageMaker Lakehouse desde las API de AWS Glue. El almacenamiento de metadatos y las solicitudes de API siguen los precios del catálogo de datos de AWS Glue, incluido el nivel gratuito de AWS. Para obtener más información, visite los precios de AWS Glue.

Almacenamiento y acceso a los datos: con SageMaker Lakehouse, puede leer y escribir datos en Amazon S3 o RMS. Según el tipo de almacenamiento que elija para almacenar los datos en el lakehouse, incurrirá en costos adicionales de almacenamiento y procesamiento para acceder al almacenamiento subyacente. Visite los precios de AWS Glue para obtener más información sobre los precios de almacenamiento y procesamiento para los tipos de almacenamiento.

Mantenimiento de estadísticas y tablas de Apache Iceberg: en SageMaker Lakehouse, puede automatizar la recopilación de estadísticas en tablas de lagos de datos en Amazon S3 para una ejecución más rápida de las consultas y el mantenimiento de las tablas de Apache Iceberg, como la compactación, para optimizar el diseño de almacenamiento de las tablas de Apache Iceberg. Incurrirá en cargos adicionales cuando habilite estas funciones. Para obtener más información, visite los precios de AWS Glue.

Permisos: los permisos detallados de SageMaker Lakehouse funcionan con AWS Lake Formation. Los permisos en SageMaker Lakehouse son gratuitos. Para obtener más información, consulta los precios de Lake Formation.

Costos de integración sin ETL

SageMaker tiene integraciones sin ETL con las aplicaciones, lo que elimina la necesidad de crear y administrar canalizaciones de extracción, transformación y carga (ETL). Las aplicaciones compatibles incluyen Salesforce, ServiceNow, Zendesk y más.

Estas integraciones le proporcionan flexibilidad, por lo que puede elegir tablas de datos específicas en una aplicación para replicarlas automáticamente en Amazon Redshift. Esta flexibilidad le permite ejecutar análisis unificados en varias aplicaciones y orígenes de datos. AWS no cobra ninguna tarifa adicional por la integración sin ETL. Debe pagar por los recursos existentes que se utilizan para crear y procesar los datos de cambios creados como parte de una integración sin ETL. Esto incluye el almacenamiento adicional de Amazon Redshift para almacenar datos replicados, recursos informáticos para procesar la replicación de datos (o las RPU en Amazon Redshift sin servidor) y los costos de transferencia de datos entre zonas de disponibilidad para trasladar los datos del origen al destino. El procesamiento continuo de los cambios de datos mediante la integración sin ETL se ofrece sin costo adicional. Para obtener más información, consulte los precios de Amazon Aurora, los precios de la base de datos relacional de Amazon (Amazon RDS) para MySQL, los precios de Amazon DynamoDB, y los precios de AWS Glue.