Управление данными и искусственным интеллектом в Amazon SageMaker

Безопасно обнаруживайте, управляйте и взаимодействуйте с данными и искусственным интеллектом

Обзор

Новое поколение Amazon SageMaker упрощает обнаружение, управление и совместную работу с данными и ИИ в вашем озере, моделях ИИ и приложениях. С помощью каталога Amazon SageMaker, созданного на основе Amazon DataZone, пользователи могут безопасно находить утвержденные данные и модели, а также получать к ним доступ с помощью семантического поиска с метаданными, созданными генеративным искусственным интеллектом. Кроме того, для поиска данных можно сделать запрос на естественном языке в Amazon Q для разработчиков. Пользователи могут последовательно определять и применять политики доступа, используя единую модель разрешений с детальными средствами управления доступом, централизованно в унифицированной Студии Amazon SageMaker (ознакомительная версия). Легко делитесь данными и активами ИИ, а также совместно работайте над ними с помощью простых рабочих процессов публикации и подписки. Используя SageMaker, вы можете обезопасить и защитить свои модели на базе искусственного интеллекта посредством ограничений Amazon Bedrock и внедрить политики ответственного использования ИИ. Укрепляйте доверие к своей организации с помощью мониторинга и автоматизации качества данных, обнаружения конфиденциальных данных и машинного обучения.

Преимущества

Откройте для себя масштабные ресурсы данных и искусственного интеллекта с помощью каталога SageMaker, созданного на базе Amazon DataZone. Усовершенствуйте обнаружение данных с помощью генеративного искусственного интеллекта, который автоматически дополняет данные и метаданные бизнес-контекстом, упрощая поиск, понимание и использование информации всеми пользователями. Легко делитесь своими данными, моделями искусственного интеллекта, текстовыми запросами и активами генеративного искусственного интеллекта с помощью фильтрации по названиям таблиц и столбцов или терминам бизнес-глоссария. Автоматически рекомендуйте ценные столбцы и соответствующие аналитические приложения для каждого набора данных, что позволяет применять правильные данные для быстрого построения надлежащих моделей. Поддерживайте как централизованные, так и децентрализованные модели управления, обеспечивая беспрепятственный обмен данными и искусственным интеллектом посредством рабочих процессов публикации и подписки в одном интерфейсе через проекты.

Завоевывайте доверие, отслеживая качество данных и происхождение данных и машинного обучения в SageMaker в режиме реального времени. Автоматизируйте профилирование данных и рекомендации по их качеству, отслеживайте правила качества данных и получайте оповещения. Решайте сложные проблемы с качеством данных, используя подходы, основанные на правилах и машинном обучении, для согласования объектов, чтобы предоставлять высококачественные данные для принятия уверенных бизнес-решений. Обеспечьте прозрачность конвейеров данных и проектов искусственного интеллекта с помощью встроенного мониторинга моделей, позволяющего выявлять предвзятость или сообщать о том, как функции влияют на прогнозирование на основе модели.
Централизуйте безопасность данных и искусственного интеллекта в SageMaker с помощью детальных средств контроля доступа, классификации данных и защитных ограничений, обеспечивающих надлежащее использование данных, аналитики и моделей искусственного интеллекта. Определите разрешения один раз и примените их к данным и моделям. Благодаря встроенной интегрированной среде разработки (IDE) Amazon Bedrock (ознакомительная версия) клиенты могут использовать ограничения Amazon Bedrock в своем приложении на базе генеративного искусственного интеллекта, блокируя вредоносный контент, фильтруя галлюцинации и обеспечивая настраиваемые меры защиты конфиденциальности, безопасности и точности. Автоматически идентифицируйте конфиденциальную информацию в своих конвейерах с помощью Amazon Comprehend.
Соблюдайте аудит и соответствие нормативным требованиям в области использования данных, регистрации и мониторинга моделей. Обеспечьте приемлемое использование аналитических ресурсов и ресурсов искусственного интеллекта на предприятии с помощью изоляции на основе проектов. Изучите использование данных и моделей в вашем озере для повышения безопасности. Применяйте Amazon SageMaker Clarify для мониторинга предвзятости, точности и надежности моделей в соответствии со стандартами ответственного использования ИИ. Сопоставьте затраты с бизнес-инициативами и получите четкое представление об инвестициях в бизнес.

Возможности

Отобранные данные для контекста и удобства поиска

Каталог привносит бизнес-контекст в ваши технические метаданные и позволяет их обогатить. Вы можете сделать данные видимыми в бизнес-контексте, чтобы все пользователи могли быстро и легко находить и понимать их, а также доверять им.

Автоматические рекомендации по метаданным

Автоматизируйте добавление описаний и названий компаний к данным, что поможет вам легко понять контекст и избежать использования скрытых технических названий. Эта автоматизация основана на больших языковых моделях (LLM) и предназначена для повышения точности и согласованности.

Обеспечьте единый уровень безопасности ИИ во всех приложениях.

Ограничения для Amazon Bedrock позволяют оценивать вводимую пользователем информацию и ответы базовой модели (FM) на основе политик для конкретных сценариев использования и обеспечивают дополнительный уровень безопасности независимо от применяемой базовой модели.

Быстрый аудит и отслеживание моделей

Быстро проводите аудит и устраняйте неполадки в работе всех моделей, конечных точек и заданий мониторинга моделей с помощью единого представления. Отслеживайте отклонения от ожидаемого поведения модели, а также отсутствующие или неактивные задания мониторинга с помощью автоматических оповещений.

Качество данных

Благодаря статистике качества данных потребители могут видеть метрики качества данных AWS или сторонних систем. Потребители данных могут принимать решения, используя надежные источники данных, и выполнять поиск ресурсов с учетом контекстной информации о качестве данных. Производители данных и ИТ-команды также могут использовать API, чтобы интегрировать статистику качества данных из сторонних систем в унифицированный портал без входа в консоль.

Происхождение данных и машинного обучения

Изучайте перемещение данных и моделей с течением времени. Происхождение может повысить доверие и грамотность организации в области данных и искусственного интеллекта, помогая клиентам данных понять, откуда поступают сведения, как они изменились и как их потребляют. Вы можете сократить время, затрачиваемое на составление схем и связей для ресурсов данных искусственного интеллекта, устранение неполадок и разработку конвейеров, а также на внедрение новых методов управления данными искусственным интеллектом.