Gegevensbeheer
Voordat u begint met de integratie en verbetering van gegevens in Cognite Data Fusion (CDF), moet u uw beleid voor gegevensbeheer definiëren en implementeren. Gegevensbeheer bestaat uit een reeks principes en procedures die een goede kwaliteit waarborgen tijdens de levenscyclus van uw gegevens. Het is een belangrijk onderdeel van gegevensbewerking om uw procedures voor gegevensbeheer continu te optimaliseren.
We raden u aan een CDF-beheerder aan te stellen die samenwerkt met de IT-afdeling om te waarborgen dat CDF voldoet aan de beveiligingsprocedures van uw organisatie. Verbind CDF ook met uw IdP (identiteitsprovider) en gebruik de bestaande IdP-gebruikersidentiteiten om de toegang tot CDF en de in CDF opgeslagen gegevens te beheren. Wij ondersteunen momenteel Microsoft's Microsoft Entra ID.
In dit gedeelte bespreken we de CDF-tools en -functies die u kunt gebruiken om te waarborgen dat uw gegevens voldoen aan de verwachtingen van uw organisatie en gebruikers.
Veilig toegangsbeheer
Als u de toegang tot gegevens in CDF wilt beheren, moet u definiëren welke mogelijkheden gebruikers of toepassingen hebben om met verschillende resourcetypen te werken in CDF, bijvoorbeeld een tijdreeks lezen of een asset verwijderen.
In plaats van mogelijkheden toe te wijzen aan individuele gebruikers en toepassingen, kunt u groepen in CDF gebruiken om te definiëren welke mogelijkheden leden (gebruikers of toepassingen) hebben om met verschillende CDF-resources te werken. U koppelt en synchroniseert de CDF-groepen met gebruikersgroepen in uw identiteitsprovider (IdP), zoals Microsoft Entra ID (ME-ID).
Als u bijvoorbeeld wilt dat gebruikers of toepassingen tijdreeksgegevens kunnen lezen, maar niet schrijven in CDF, maakt u eerst een groep in uw IdP om de betreffende gebruikers en toepassingen toe te voegen. Vervolgens maakt u een CDF-groep met de nodige mogelijkheden en koppelt u de CDF-groep en de IdP-groep.
Dankzij deze flexibiliteit kunt u uw beleid voor gegevensbeheer snel en veilig beheren en bijwerken. U kunt gebruikers en toepassingen blijven beheren in de IdP-service van uw organisatie buiten CDF om.
Gegevensherkomst en -integriteit
Wanneer u uw operationele besluiten baseert op gegevens, is het essentieel om te weten wanneer de gegevens betrouwbaar zijn en dat eindgebruikers weten wanneer ze op de gegevens kunnen vertrouwen om besluiten te nemen. CDF biedt tools en functies om te waarborgen dat uw gegevens voldoen aan de verwachtingen van de organisatie en de gebruiker.
Gegevenssets
Met gegevenssets kunt u de herkomst van gegevens documenteren en volgen, gegevensintegriteit waarborgen en derden in staat stellen hun inzichten veilig terug te schrijven naar uw CDF-project. We raden u aan om alle gegevens in CDF te ordenen in gegevenssets, zodat u altijd weet waar de gegevens vandaan komen en wie er verantwoordelijk voor is.
Met gegevenssets worden gegevens gegroepeerd en bijgehouden per bron. Een gegevensset kan bijvoorbeeld alle werkorders bevatten die afkomstig zijn uit SAP. Doorgaans heeft een organisatie één gegevensset voor elke pijplijn voor gegevensinvoer in CDF. Elk gegevensobject in CDF kan slechts behoren tot één gegevensset.
Een gegevensset is een container voor gegevensobjecten met metagegevens over de betreffende gegevens. U kunt de metagegevens van de gegevensset bijvoorbeeld gebruiken om te documenteren wie verantwoordelijk is voor de gegevens, of om documentatiebestanden te uploaden en de gegevensherkomst te beschrijven. Gegevenssets zijn een afzonderlijk resourcetype in CDF.
Doorgaans wordt er programmacode gebruikt in de pijplijnen voor gegevensinvoer om te definiëren welke gegevensobjecten tot een gegevensset behoren, bijvoorbeeld gebeurtenissen, bestanden en tijdreeksen. Gegevensobjecten kunnen slechts behoren tot één gegevensset, zodat u voor elk gegevensobject ondubbelzinnig de herkomst kunt traceren.