Hoppa till huvudinnehållet

Datastyrning

Innan du börjar integrera och förbättra data i Cognite Data Fusion (CDF) bör du definiera och implementera dina policyer för datastyrning. Datastyrning är en uppsättning principer och metoder som säkerställer hög kvalitet genom din datas livscykel. Det är en viktig del av datadrift att kontinuerligt optimera dina datahanteringsmetoder.

Vi rekommenderar att du utser en CDF-administratör som ska arbeta med IT-avdelningen för att säkerställa att CDF följer din organisations säkerhetspraxis. Anslut också CDF till din IdP (Identity Provider), och använd befintliga IdP-användaridentiteter för att hantera åtkomst till CDF och data som lagras i CDF. Vi stöder för närvarande Microsoft's Microsoft Entra ID (formerly Azure Active Directory).

Den här enheten tittar på CDF-verktygen och funktionerna som du kan använda för att se till att din data överensstämmer med din organisations och användarnas förväntningar.

Säkra behörighetshantering

För att kontrollera åtkomsten till data i CDF definierar du vilka funktioner användare eller program har för att arbeta med olika resurstyper i CDF, t.ex. om de kan läsa en tidsserie eller radera en tillgång.

Grupper

Istället för att tilldela funktioner till enskilda användare och applikationer använder du grupper i CDF för att definiera vilka kapaciteter medlemmar (användare eller applikationer) har för att arbeta med olika CDF-resurser. Din länk och synkronisera CDF-grupperna till användargrupper i din identitetsleverantör (IdP), t.ex. Microsoft Entra ID (ME-ID).

Om du till exempel vill att användare eller program ska kunna läsa, men inte skriva, tidsseriedata i CDF, skapar du först en grupp i din IdP för att lägga till relevanta användare och program. Därefter skapar du en CDF-grupp med nödvändiga möjligheter och länkar sedan CDF-gruppen och IdP-gruppen.

Denna flexibilitet låter dig hantera och uppdatera dina datastyrningspolicyer snabbt och säkert. Du kan fortsätta att hantera användare och applikationer i din organisations IdP-tjänst utanför CDF.

Datahärkomst och integritet

När du förlitar dig på data för att fatta operativa beslut är det viktigt att du vet när data är tillförlitliga och att slutanvändare vet när de kan lita på data för att fatta beslut. CDF har verktyg och funktioner för att säkerställa att din data överensstämmer med organisationens och användarnas förväntningar.

Dataset

Dataset låter dig dokumentera och spåra datalinje, säkerställa dataintegritet och låta tredje part skriva sina insikter säkert tillbaka till ditt CDF-projekt. Vi rekommenderar att du organiserar alla data i CDF i dataset för att alltid veta var data kommer ifrån och vem som är ansvarig för dem.

Dataset grupperar och spårar data efter källan. Till exempel kan ett dataset innehålla alla arbetsordrar som härrör från SAP. Normalt kommer en organisation att ha ett dataset för varje dataintagspipelines i CDF. Varje dataobjekt i CDF kan endast tillhöra ett dataset.

Ett dataset är en behållare för dataobjekt med metadata om de data den innehåller. Du kan till exempel använda datamängden metadata för att dokumentera vem som är ansvarig för datan, ladda upp dokumentationsfiler och beskriva datamängden. I CDF är datamängder en separat resurstyp.

Dataset

Vanligtvis definierar du programmatiskt i datainmatningspipelines vilka dataobjekt, till exempel händelser, filer och tidsserier, som tillhör en datamängd. Dataobjekt kan bara tillhöra en datamängd så att du entydigt kan spåra datalinjen för varje dataobjekt.

Mer information