Preguntas frecuentes sobre la gobernanza de datos e IA de Amazon SageMaker

Gobernanza de datos e IA

La próxima generación de Amazon SageMaker simplifica el descubrimiento, la gobernanza y la colaboración de datos y la IA en sus lakehouse, modelos de IA y aplicaciones. Con Amazon SageMaker Catalog, creado en Amazon DataZone, los usuarios pueden descubrir y acceder de forma segura a datos y modelos aprobados mediante la búsqueda semántica con metadatos creados por IA generativa, o simplemente, pueden pedirle a Q Developer con lenguaje natural que encuentre sus datos. Los usuarios pueden definir y aplicar políticas de acceso de forma coherente mediante un único modelo de permisos con controles de acceso detallados de forma centralizada en SageMaker Unified Studio (versión preliminar). Comparta y colabore sin problemas en datos y activos de IA mediante flujos de trabajo sencillos de publicación y suscripción. Con Amazon SageMaker, puede salvaguardar y proteger sus modelos de IA mediante las barreras de protección de Amazon Bedrock e implementar políticas de IA responsable. Genere confianza en toda su organización con la supervisión y automatización de la calidad de los datos, la detección de datos confidenciales y el linaje de datos y ML.

Puede acceder al catálogo de SageMaker a través de Amazon SageMaker Unified Studio (versión preliminar), que es un entorno único para el desarrollo de datos e IA. Para configurar o integrar los procesos existentes mediante programación, SageMaker Catalog ha publicado una serie de API con pautas sobre cómo utilizar las API de Amazon DataZone.

  • Dificultad para encontrar y compartir datos entre equipos: los productores y consumidores de datos a menudo se encuentran con dificultades para ubicar y compartir conjuntos de datos relevantes de forma rápida en toda la organización. Esta ineficiencia conduce a una pérdida de tiempo en la búsqueda de datos y limita la colaboración.
  • Falta de confianza en la calidad de los datos y en los resultados de los modelos de IA: las organizaciones luchan por confiar en la calidad de sus datos y en la precisión de los resultados de los modelos de IA debido a la falta de visibilidad de los orígenes, la calidad y los patrones de acceso de los datos.
  • Acceso inconsistente a datos y violaciones de privacidad: las organizaciones luchan por aplicar políticas de acceso a los datos coherentes, lo que conduce a un posible acceso no autorizado a información confidencial.
  • Dificultad para mantener el cumplimiento de las normas y políticas internas: a las organizaciones les resulta difícil mantener el cumplimiento normativo y adherirse a las políticas internas debido a la falta de herramientas integrales de auditoría y supervisión.

La gobernanza de datos e IA de Amazon en Amazon SageMaker ayuda a los equipos de datos a lograr lo siguiente:

  • Descubrimiento de datos y colaboración más rápidos: los usuarios pueden encontrar y compartir rápidamente datos relevantes en toda la organización, lo que reduce el tiempo dedicado a buscar información y promueve el trabajo en equipo.
  • Mayor confianza a través del linaje y la calidad: seguimiento del origen de los datos y mejora de la calidad de los datos para aumentar la confianza en las decisiones basadas en datos y en los resultados de los modelos de IA.
  • Seguridad mejorada de los modelos de datos e IA: asegurarse de que los datos y los modelos solo sean accesibles a través de proyectos, garantiza que solo las personas autorizadas para ver los activos del proyecto puedan acceder a ellos y se cumpla con los estándares de seguridad y privacidad.
  • Reducción del riesgo empresarial y mejor cumplimiento normativo: las actividades de registro ayudan a las organizaciones a alinearse con las normativas del sector y las políticas internas, lo que ayuda a reducir los riesgos organizacionales.
  • Liberación de la productividad empresarial con la búsqueda y el descubrimiento de activos: busque y descubra datos y activos de IA para potenciar a los equipos, reducir el tiempo dedicado a encontrar activos críticos e impulsar una toma de decisiones más rápida basada en los datos.
  • Administración centralizada de políticas de acceso a los datos: defina y administre las reglas de acceso a los datos desde un único punto, lo que lleva a una aplicación uniforme en varios servicios de AWS y entornos de terceros.
  • Enriquecimiento de datos con el contexto empresarial y la clasificación: agregue metadatos y categorización a los conjuntos de datos, lo que facilita a los usuarios comprender la relevancia y la aplicabilidad de los datos a las necesidades empresariales específicas.
  • Registro de las actividades de los usuarios y los sistemas: supervise y registre las interacciones con los sistemas de datos y de IA para proporcionar visibilidad de los patrones de uso y los posibles problemas de seguridad.
  • Implementación de la gobernanza de datos de IA y ML: extienda los principios de gobernanza de datos a los procesos de IA y machine learning para garantizar que solo se utilicen datos aprobados en el entrenamiento del modelo y que los sistemas de IA cumplan con los permisos definidos y las pautas éticas.

Amazon SageMaker Catalog se basa en Amazon DataZone y ofrece las mismas capacidades de gobernanza en una experiencia de usuario unificada. La experiencia de Amazon DataZone sigue siendo la misma, lo que permite a los clientes actuales de Amazon DataZone seguir utilizando la interfaz que ya conocen si así lo desean.

Los detalles de los precios se pueden encontrar aquí: https://aws.amazon.com/datazone/pricing/.