Saltar al contenido principal

Gobernanza de datos

Antes de comenzar a integrar y mejorar los datos en Cognite Data Fusion (CDF), debe definir e implementar sus políticas de gobernanza de datos. La gobernanza de datos es un conjunto de principios y prácticas que garantizan una alta calidad a lo largo del ciclo de vida de sus datos. Es una parte clave de las operaciones de datos para optimizar continuamente las prácticas de gestión de datos.

Le recomendamos que designe a un administrador de CDF para trabajar con el departamento de TI a fin de asegurarse de que CDF siga las prácticas de seguridad de su organización. Además, conecte CDF a su IdP (proveedor de identidad) y use las identidades de usuario de IdP existentes para administrar el acceso a CDF y los datos almacenados en CDF. Actualmente somos compatibles con Microsoft's Microsoft Entra ID.

En esta unidad, se analizan las herramientas y funciones de CDF que puede utilizar para asegurarse de que sus datos se ajusten a las expectativas de su organización y de los usuarios.

Gestión de acceso seguro

Para controlar el acceso a los datos en CDF, defina qué funcionalidades tienen los usuarios o aplicaciones para trabajar con diferentes tipos de recursos en CDF, por ejemplo, si pueden leer una serie cronológica o eliminar un activo.

Grupos

En lugar de asignar funcionalidades a usuarios y aplicaciones individuales, use grupos en CDF para definir qué funcionalidades tienen los miembros (usuarios o aplicaciones) para trabajar con diferentes recursos de CDF. Enlace y sincronice los grupos de CDF con grupos de usuarios en su proveedor de identidad (IdP), por ejemplo Microsoft Entra ID (ME-ID).

Por ejemplo, si desea que los usuarios o las aplicaciones lean, pero no escriban, datos de series cronológicas en CDF, primero debe crear un grupo en su IdP para agregar los usuarios y aplicaciones relevantes. A continuación, cree un grupo de CDF con las funcionalidades necesarias y, luego, vincule el grupo de CDF y el grupo de IdP.

Esta flexibilidad le permite administrar y actualizar sus políticas de gobernanza de datos de forma rápida y segura. Puede continuar administrando usuarios y aplicaciones en el servicio de IdP de su organización fuera de CDF.

Linaje e integridad de datos

Cuando confía en los datos para tomar decisiones operativas, es fundamental que sepa cuándo son confiables y que los usuarios finales sepan cuándo pueden confiar en los datos para tomar decisiones. CDF tiene herramientas y características para garantizar que sus datos se ajusten a las expectativas de la organización y del usuario.

Conjuntos de datos

Los conjuntos de datos le permiten documentar y rastrear el linaje de datos, garantizar su integridad y permitir que terceros escriban sus conocimientos de forma segura en su proyecto CDF. Le recomendamos que organice todos los datos en CDF en conjuntos de datos para saber siempre de dónde provienen y quién es responsable de ellos.

Los conjuntos de datos agrupan y rastrean datos según su origen. Por ejemplo, un conjunto de datos puede contener todas las órdenes de trabajo que se originan en SAP. Por lo general, una organización tendrá un conjunto de datos para cada canalización de ingesta de datos en CDF. Cada objeto de datos en CDF puede pertenecer a un solo conjunto de datos.

Un conjunto de datos es un contenedor para objetos de datos con metadatos sobre los datos que contiene. Por ejemplo, puede usar los metadatos del conjunto de datos para documentar quién es responsable de los datos, cargar archivos de documentación y describir el linaje de los datos. En CDF, los conjuntos de datos son un tipo de recurso independiente.

Conjunto de datos

Por lo general, debe definir mediante programación en las canalizaciones de ingesta de datos qué objetos de datos, por ejemplo, eventos, archivos y series cronológicas, pertenecen a un conjunto de datos. Los objetos de datos pueden pertenecer a un solo conjunto de datos para que pueda rastrear sin ambigüedades el linaje de datos para cada objeto de datos.

Más información