Datastyring
Før du begynner å integrere og forbedre data i Cognite Data Fusion (CDF), bør du definere og implementere retningslinjene dine for datastyring. Datastyring er et sett med prinsipper og praksiser som sikrer høy kvalitet i hele livssyklusen til dataene. Det er en viktig del av dataoperasjoner for hele tiden å optimalisere praksisen din når det gjelder dataadministrasjon.
Vi anbefaler at du utpeker en CDF-administrator til å jobbe med IT-avdelingen for å sikre at CDF følger bedriftens sikkerhetspraksis. Du bør også koble CDF til IdP-en (identitetsleverandøren) din, og bruk de eksisterende IdP-brukeridentitetene til å administrere tilgangen til CDF og dataene som er lagret i CDF. Vi støtter foreløpig Microsoft's Microsoft Entra ID.
Denne enheten ser på CDF-verktøyene og -funksjonene du kan bruke for å sikre at dataene dine samsvarer med bedriftens og brukernes forventninger.
Administrasjon av sikker tilgang
Du kan styre tilgangen til data i CDF ved å definere hvilke funksjoner brukere eller apper har for å arbeide med ulike ressurstyper i CDF, for eksempel om de kan avlese en tidsserie eller slette en tagg.
I stedet for å tilordne funksjoner til individuelle brukere eller apper, kan du bruke grupper i CDF til å definere hvilke funksjoner medlemmer (brukere eller apper) har for å arbeide med ulike CDF-ressurser. Du kobler og synkroniserer CDF-gruppene til brukergrupper i identitetsleverandøren (IdP) din, for eksempel Microsoft Entra ID (ME-ID).
Hvis du for eksempel vil at brukere eller apper skal kunne lese, men ikke skrive tidsseriedata i CDF, oppretter du først en gruppe i IdP-en din for å legge til de aktuelle brukerne og appene. Deretter oppretter du en CDF-gruppe med de nødvendige funksjonene og kobler CDF-gruppen sammen med IdP-gruppen.
Denne fleksibiliteten gjør at du kan administrere og oppdatere retningslinjene for datastyring raskt og trygt. Du kan fortsette å administrere brukere og apper i bedriftens IdP-tjeneste utenfor CDF.
Dataenes opprinnelse og integritet
Når du er avhengig av data for å kunne ta driftsmessige beslutninger, er det kritisk at du vet når dataene er pålitelige, og at sluttbrukere vet når de kan stole nok på dataene til å kunne ta beslutninger. CDF har verktøy og funksjoner som sørger for at dataene samsvarer med bedriftens og brukernes forventninger.
Datasett
Med datasett kan du dokumentere og spore dataenes opprinnelse, sørge for dataintegritet og gjøre det mulig for tredjeparter å skrive innsikt trygt tilbake i CDF-prosjektet. Vi anbefaler at du organiserer alle dataene i CDF i datasett, slik at du alltid vet hvor data kommer fra, og hvem som er ansvarlig for dem.
Datasett grupperer og sporer data etter datakilden. Et datasett kan for eksempel inneholde alle arbeidsordrer som stammer fra SAP. En bedrift vil normalt ha ett datasett for hver datainntaksledning i CDF. Hvert dataobjekt i CDF kan bare tilhøre ett datasett.
Et datasett er en beholder for dataobjekter med metadata om dataene den inneholder. Du kan for eksempel bruke datasettets metadata til å dokumentere hvem som er ansvarlig for dataene, laste opp dokumentasjonsfiler og beskrive dataenes opprinnelse. I CDF er datasett en egen ressurstype.
Vanligvis definerere du programmatisk i datainntaksledningene hvilke dataobjekter, for eksempel hendelser, filer eller tidsserier, som tilhører et datasett. Dataobjekter kan bare tilhøre ett datasett, slik at du utvetydig kan spore dataenes opprinnelse for hvert dataobjekt.