Gobernanza de datos e IA de Amazon SageMaker

Descubrir, gobernar y colaborar con datos e IA de forma segura

Información general

La próxima generación de Amazon SageMaker simplifica el descubrimiento, la gobernanza y la colaboración de datos y la IA en sus lakehouse, modelos de IA y aplicaciones. Con el catálogo de Amazon SageMaker, creado en Amazon DataZone, los usuarios pueden descubrir datos y modelos aprobados y acceder a ellos de forma segura mediante la búsqueda semántica con metadatos creados mediante IA generativa, o simplemente pueden pedirle a Amazon Q Developer que encuentre sus datos con lenguaje natural. Los usuarios pueden definir y aplicar políticas de acceso de forma coherente mediante un único modelo de permisos con controles de acceso detallados de forma centralizada en Amazon SageMaker Unified Studio (vista preliminar). Comparta y colabore sin problemas en datos y activos de IA mediante flujos de trabajo sencillos de publicación y suscripción. Con SageMaker, puede proteger sus modelos de IA mediante las barreras de protección de Amazon Bedrock e implementar políticas de IA responsables. Genere confianza en toda su organización con la supervisión y automatización de la calidad de los datos, la detección de datos confidenciales, y el linaje de datos y machine learning (ML).

Beneficios

Descubra sus datos y activos de IA a escala con el catálogo de SageMaker, creado en Amazon Datazone. Mejore el descubrimiento de datos con IA generativa para enriquecer de forma automática sus datos y metadatos con el contexto empresarial, lo que facilita a todos los usuarios la búsqueda, la comprensión y el uso de los datos. Comparta sus datos, modelos de IA, peticiones y activos de IA generativa mediante el filtrado por nombres de tablas y columnas o términos de glosarios empresariales. Recomiende de forma automática columnas valiosas y aplicaciones analíticas relevantes para cada conjunto de datos, lo que permite usar los datos correctos para crear rápidamente los modelos correctos. Respalde los modelos de gobernanza centralizados y descentralizados con un intercambio fluido de datos e IA mediante flujos de trabajo de publicación y suscripción en una sola experiencia a través de Projects.

Gane confianza gracias a la visibilidad en tiempo real de la calidad de los datos, así como del linaje de datos y ML en SageMaker. Automatice la elaboración de perfiles de datos y las recomendaciones sobre la calidad de los datos, supervise las reglas de calidad de los datos y reciba alertas. Resuelva los problemas de calidad de datos difíciles de encontrar mediante enfoques basados en reglas y machine learning para conciliar entidades, de modo que pueda ofrecer datos de alta calidad para tomar decisiones empresariales con confianza. Impulse la transparencia en las canalizaciones de datos y los proyectos de IA con la supervisión de modelos integrada para detectar sesgos o informar sobre cómo las características contribuyen a la predicción del modelo.
Centralice la seguridad de los datos y la IA en SageMaker con controles de acceso detallados, clasificación de datos y barreras de protección para garantizar que los datos, los análisis y los modelos de IA se utilicen de forma adecuada. Defina los permisos una vez y aplíquelos en todos los datos y modelos. Con el IDE de Amazon Bedrock (versión preliminar) integrado de forma nativa, los clientes pueden usar las barreras de protección de Amazon Bedrock en su aplicación de IA generativa al bloquear el contenido dañino, filtrar las alucinaciones y habilitar protecciones personalizables para la privacidad, la seguridad y la precisión. Identifique de forma automática la información confidencial en sus canalizaciones con Amazon Comprehend.
Cumpla con las normativas y las auditorías relativas al uso de datos, al registro y la supervisión de modelos. Fomente el uso aceptable de sus activos de análisis e IA en toda la empresa con un aislamiento basado en proyectos. Comprenda el uso de datos y modelos en su lakehouse para mejorar la seguridad. Utilice Amazon SageMaker Clarify para supervisar el sesgo, la precisión y la solidez de los modelos y alinearlos con sus estándares de IA responsable. Alinee los costos con las iniciativas empresariales y proporcione una visión clara de sus inversiones empresariales.

Características

Datos seleccionados para crear contexto y facilitar la búsqueda

El catálogo SageMaker aporta el contexto empresarial a sus metadatos técnicos y permite enriquecerlos con dicho contexto. Puede hacer que los datos sean visibles en el contexto empresarial para que todos los usuarios los encuentren, comprendan y confíen en ellos de manera rápida y sencilla.

Recomendaciones de metadatos automatizadas

Automatice la inclusión de nombres y descripciones de empresas en los datos. De este modo, facilita la comprensión del contexto y evita tener que lidiar con nombres técnicos encriptados. Esta automatización se apoya en modelos de lenguaje de gran tamaño (LLM) a fin de aumentar la precisión y la coherencia.

Ofrezca un nivel uniforme de seguridad de IA en todas sus aplicaciones

Las barreras de protección de Amazon Bedrock ayudan a evaluar las entradas de los usuarios y las respuestas de los modelos fundacionales (FM), según las políticas específicas de cada caso de uso, y ofrecen un nivel adicional de protección independientemente de los FM subyacentes.

Audite y realice un seguimiento rápidos de los modelos

Audite rápidamente y solucione problemas de rendimiento para todos los modelos, puntos de enlace y trabajos de monitoreo de modelos mediante una vista unificada. Supervise las desviaciones del comportamiento esperado del modelo, así como los trabajos de monitoreo inactivos o faltantes, con alertas automatizadas.

Calidad de los datos

Gracias a las estadísticas de calidad de los datos, los consumidores de datos pueden ver las métricas de calidad de estos en los sistemas de AWS o de terceros. Los consumidores de datos pueden confiar en los orígenes de datos que usar para tomar decisiones y disponer de un contexto de calidad de datos mientras buscan activos. Los productores de datos y los equipos de TI también pueden usar las API para incorporar estadísticas de calidad de los datos de sistemas de terceros en un portal unificado fuera de la consola.

Linaje de datos y ML

Comprenda el movimiento de los datos y los modelos a lo largo del tiempo. El linaje puede aumentar tanto la fiabilidad como el nivel de conocimiento de los datos por parte de una organización, ya que ayuda a los consumidores de datos a comprender su procedencia, sus cambios y su consumo. Puede reducir el tiempo destinado a la asignación de datos y activos de IA y sus relaciones, solucionar problemas, desarrollar canalizaciones y consolidar las prácticas de gobernanza de datos e IA.