Amazon SageMaker Lakehouse

Упростите аналитику и ИИ с помощью унифицированного, открытого и безопасного озера данных

Что такое SageMaker Lakehouse?

Amazon SageMaker Lakehouse объединяет все ваши данные в озерах данных Amazon Simple Storage Service (Amazon S3) и хранилищах данных Amazon Redshift, помогая создавать мощные аналитические приложения и приложения искусственного интеллекта, а также машинного обучения, используя одну копию данных. SageMaker Lakehouse предоставляет гибкий доступ к данным и запросы к ним на месте с помощью всех инструментов и движков, совместимых с Apache Iceberg. Защитите свои данные в озере, определив детальные разрешения, применимые ко всем инструментам и движкам аналитики и машинного обучения. Переносите данные из операционных баз данных и приложений в свое озеро в режиме, близком к реальному времени, с помощью интеграции с нулевым использованием ETL. Кроме того, вы можете получать доступ к данным и запрашивать их по месту с помощью функций объединенных запросов из сторонних источников данных.

Преимущества

Объедините все сведения в озерах данных Amazon S3 и хранилищах данных Amazon Redshift с помощью SageMaker Lakehouse. Переносите информацию из операционных баз данных и приложений на озеро практически в режиме реального времени благодаря интеграции с нулевым использованием ETL. Для интеграции данных из различных источников можно использовать сотни коннекторов. Кроме того, вы можете получать доступ к данным и запрашивать их на месте с помощью функций объединенных запросов из сторонних источников данных.
Обретите возможность получать доступ к данным и запрашивать их на месте с помощью всех инструментов, совместимых с Apache Iceberg, в одной копии данных. Вы можете использовать такие инструменты и движки аналитики по своему усмотрению, как SQL, Apache Spark, бизнес-аналитику (BI) и инструменты искусственного интеллекта и машинного обучения, а также совместно работать с данными, хранящимися в озерах данных Amazon S3 и хранилищах данных Amazon Redshift. SageMaker Lakehouse с существующей архитектурой данных, позволяющий использовать предпочтительные форматы хранения и механизмы запросов, совместимые с Apache Iceberg.
Защитите свои данные с помощью интегрированных и детальных средств контроля доступа, применяемых ко всем данным во всех аналитических инструментах и движках. Определите разрешения один раз и уверенно делитесь данными в своей организации.

Примеры использования

Объедините все данные в озерах данных Amazon S3 и хранилищах данных Amazon Redshift для реализации инициатив по аналитике и искусственному интеллекту с помощью единой копии данных. Благодаря интегрированным средствам управления доступом SageMaker Lakehouse позволяет точно определять разрешения и безопасно передавать единую копию данных по всей организации.
Получайте доступ к сведениям в оперативных базах данных и приложениях SageMaker Lakehouse в режиме, близком к реальному времени, благодаря интеграции с нулевым использованием ETL. Получайте доступ к данным и запрашивайте их на месте с помощью широкого спектра сервисов AWS, инструментов и движков сторонних разработчиков с открытым исходным кодом, поддерживающих Apache Iceberg.
Перенесите существующие данные из нескольких хранилищ данных Amazon Redshift в SageMaker Lakehouse, чтобы запрашивать и объединять данные, хранящиеся в кластерах и рабочих группах Redshift. Масштабируйте рабочие нагрузки для процессов извлечения, преобразования и загрузки (ETL), отчетов бизнес-аналитики и анализа по мере необходимости без управления несколькими общими данными.