¿Por qué utilizar la calidad de datos de Glue?
Los lagos de datos pueden convertirse en pantanos de datos sin la supervisión adecuada. La configuración de las comprobaciones de calidad de los datos lleva mucho tiempo, es tediosa y es propensa a errores. Debe crear reglas de calidad de datos manualmente y escribir código para supervisar las canalizaciones de datos y alertar a los consumidores de datos cuando la calidad de los datos se deteriore. Calidad de datos de AWS Glue reduce estos esfuerzos de calidad manual de días a horas. Calcula automáticamente las estadísticas, recomienda normas de calidad, supervisa y alerta cuando detecta problemas. Para problemas ocultos y difíciles de encontrar, Calidad de datos de Glue utiliza algoritmos de machine learning. La potencia combinada del enfoque basado en reglas y la tecnología de machine learning, junto con la solución abierta, escalable y sin servidores, le permiten ofrecer datos de alta calidad para tomar decisiones empresariales seguras.