Datu pārvaldība
Pirms sākat integrēt un papildināt datus platformā Cognite Data Fusion (CDF), ir jādefinē un jāievieš datu pārvaldības politikas. Datu pārvaldība ir principu un procedūru kopums, kas datu dzīvescikla laikā nodrošina augstu šo datu kvalitāti. Tā ir būtiska datu operāciju sastāvdaļa nepārtrauktai datu pārvaldības procedūru optimizēšanai.
Ieteicams iecelt CDF administratoru, kas sadarbosies ar IT nodaļu, lai nodrošinātu CDF atbilstību jūsu organizācijas drošības pasākumiem. Izveidojiet arī CDF savienojumu ar IdP (identitātes nodrošinātāja) pakalpojumu un izmantojiet esošās IdP lietotāju identitātes, lai pārvaldītu piekļuvi platformai CDF un platformā CDF glabātajiem datiem. Mēs pašlaik atbalstām Microsoft's Microsoft Entra ID (formerly Azure Active Directory.
Šajā sadaļā tiek aplūkoti CDF rīki un funkcijas, kuras varat izmantot, lai nodrošinātu datu atbilstību organizācijas un lietotāju gaidām.
Droša piekļuves pārvaldība
Lai kontrolētu piekļuvi datiem platformā CDF, jādefinē iespējas, kuras lietotājiem vai lietojumprogrammām būs pieejamas darbā ar dažādu veidu resursiem platformā CDF, piemēram, vai tie varēs nolasīt laika rindas vai dzēst aktīvus.
Tā vietā, lai piešķirtu iespējas atsevišķiem lietotājiem un lietojumprogrammām, varat platformā CDF izmantot grupas, lai noteiktu, kādas iespējas dalībniekiem (lietotājiem vai lietojumprogrammām) jāizmanto darbā ar dažādiem CDF resursiem. Saistiet un sinhronizējiet CDF grupas ar lietotāju grupām identitātes nodrošinātāja (IdP) pakalpojumā, piemēram, Microsoft Entra ID (ME-ID).
Piemēram, ja vēlaties, lai lietotāji vai lietojumprogrammas varētu lasīt, bet nevarētu rakstīt laika rindu datus platformā CDF, vispirms ir jāizveido grupa IdP, kurai jāpievieno attiecīgie lietotāji un lietojumprogrammas. Pēc tam ir jāizveido CDF grupa ar nepieciešamajām iespējām un jāsavieno CDF grupa ar IdP grupu.
Šī elastība ļauj ātri un drošā veidā kontrolēt un atjaunināt datu pārvaldības politikas. Varat turpināt pārvaldīt lietotājus un lietojumprogrammas savas organizācijas IdP pakalpojumā ārpus CDF.
Datu izcelsme un integritāte
Izmantojot datus uzņēmējdarbībai svarīgu lēmumu pieņemšanā, ir ļoti svarīgi, lai jūs zinātu, ka dati ir uzticami, un lai lietotāji zinātu, ka tie var uzticēties šiem datiem, pieņemot lēmumus. CDF ir rīki un funkcijas, lai nodrošinātu, ka jūsu dati atbilst organizācijas un lietotāju vēlmēm.
Datu kopas
Datu kopas nodrošina iespēju dokumentēt un izsekot datu izcelsmi, nodrošināt datu integritāti, kā arī ļauj trešajām pusēm drošā veidā nosūtīt savus novērojumus atpakaļ uz CDF projektu. Ieteicams visus datus kārtot CDF datu kopās, lai vienmēr zinātu, no kurienes šie dati nāk un kurš par tiem ir atbildīgs.
Datu kopas grupē un izseko datus pēc to avota. Piemēram, datu kopā var būt ietverti visi darba uzdevumi, kas izveidoti programmatūrā SAP. Parasti organizācijām ir viena datu kopa katram datu uzņemšanas kanālam platformā CDF. Katrs datu objekts platformā CDF var piederēt tikai vienai datu kopai.
Datu kopa ir datu objektu konteiners ar metadatiem par datiem, ko tā satur. Piemēram, varat izmantot datu kopas metadatus, lai dokumentētu, kurš ir atbildīgs par datiem, augšupielādētu dokumentācijas failus un aprakstītu datu izcelsmi. Platformā CDF datu kopas ir atsevišķs resursu veids.
Parasti datu uzņemšanas kanālos programmatiski norāda, kuri datu objekti, piemēram, notikumi, faili un laika rindas, pieder datu kopai. Datu objekti var piederēt tikai vienai datu kopai, tādējādi ir iespējams nepārprotami izsekot katra datu objekta datu izcelsmi.