Arkitektur og implementering – trinn

I dette kapittelet delen får du oversikt over ~~Cognite Data Fusion~~ (~~CDF~~) og ~~CDF~~-arkitekturen på høyt nivå. Du får også en innføring i de viktigste trinnene for å implementere ~~CDF~~.

Bruk ~~CDF~~-plattformen for kontekstualisering og dataoperasjoner:

Kontekstualisering er en prosess som kombinerer maskinlæring, en kraftig regelmotor og kunnskap om området for å kunne tilordne ressurser fra ulike kildesystemer til hverandre i ~~CDF~~-datamodellen.

Start med å kontekstualisere dataene med maskinlæring og regelmotorer. Deretter lar du eksperter på området validere og finjustere resultatene. De resulterende raffinerte dataene og de antydede innsiktene er grunnlaget for å skalere ~~CDF~~-implementeringen og -løsningene i hele bedriften etter hvert som du utvikler en dypere forståelse av dataene.

Dataoperasjoner er et sett med verktøy og ulike praksisformer for å administrere dataenes livssyklus gjennom samarbeid og automatisering.

Verktøy som uttrekkere, transformatorer, datasett, kvalitetsovervåking og maskinlæringsmodeller lar datateknikere, dataforskere, dataanalytikere og personer innen andre fagområder i bedriften samarbeide for å etablere, automatisere og kontinuerlig optimalisere datastyringen og ulike praksiser for beslutningstaking.

Du lærer mer om kontekstualisering og dataoperasjoner senere i dette emnet, men først skal vi se på den grunnleggende ~~CDF~~-arkitekturen.

~~CDF~~-plattformen kjører i skyen og har modulær utforming, som illustrert her:

I avsnittet nedenfor får du en innføring i hovedtrinnene når du skal implementere ~~CDF~~, og hvordan de henger sammen med de ulike ~~CDF~~-modulene. I senere enheter får du flere detaljer om hvert av trinnene.

Trinn 1: Konfigurere datastyring

Når du er avhengig av data for å kunne ta driftsmessige beslutninger, er det kritisk at du vet når dataene er pålitelige, og at sluttbrukere vet når de kan stole nok på dataene til å kunne ta beslutninger.

Før du begynner å integrere og forbedre data i (~~CDF~~), må du definere og implementere retningslinjene dine for datastyring. Vi anbefaler at du utpeker en ~~CDF~~-administrator som kan jobbe sammen med IT-avdelingen for å sikre at ~~CDF~~ følger bedriftens sikkerhetspraksis. Du bør også koble ~~CDF~~ til IdP-en (identitetsleverandøren) din, og bruk de eksisterende IdP-brukeridentitetene til å administrere tilgangen til ~~CDF~~ og dataene som er lagret i ~~CDF~~.

Med ~~CDF~~-verktøy og -funksjoner kan du organisere og overvåke datastyring, etablere sikret datatilgang, spore dataenes opprinnelse og sikre dataenes integritet.

Trinn 2: Integrer data

Når du har datastyring på plass, kan de som utfører systemintegreringen, begynne arbeidet med å integrere data i ~~CDF~~ fra IT- og OT-datakildene (IT = informasjonsteknologi, OT = operasjonell teknologi). Disse systemene kan vært alt fra industrielle kontrollsystemer som leverer sensordata, til ERP-systemer til massive 3D-CAD-modeller i tekniske systemer.

Trekk ut data

Med lesetilgang til datakildene kan du konfigurere systemintegreringen til å strømme data til ~~CDF~~-landingssonen, der dataene kan normaliseres og forbedres. Vi støtter standardprotokoller og grensesnitt som ~~PostgreSQL~~ og ~~OPC-UA~~ for å tilrettelegge for dataintegrering med de eksisterende ETL-verktøyene dine og datalagerløsningene.

Vi har også uttrekkere som er skreddersydd for bransjespesifikke systemer og standard ETL-verktøy for mer tradisjonelle tabulære data i ~~SQL~~-kompatible databaser. Denne tilnærmingen gjør at vi kan redusere logikken i uttrekkerne og kjøre endring av data i skyen om og om igjen.

Endre data

I ~~CDF~~-landingssonen lagres dataene i originalformatet. Denne tilnærmingen lar deg kjøre endringer av data i skyen om og om igjen og forme dem på nytt, slik at de passer til ~~CDF~~-datamodellen. Vi kommer tilbake til datamodellen i en senere enhet.

Avkobling av uttrekkings- og endringstrinnene gjør det enklere å vedlikeholde integreringskanalene og redusere belastningen på kildesystemene. Vi anbefaler at du bruker de eksisterende ETL-verktøyene til å endre dataene, men vi tilbyr også ~~CDF~~-transformeringsverktøyet som et alternativ ved lette endringsjobber.

Forbedre data

De automatiske og interaktive kontekstualiseringsverktøyene i ~~CDF~~ lar deg kombinere maskinlæring, en kraftig regelmotor og ekspertise på området for å kunne tilordne ressurser fra ulike kildesystemer til hverandre i ~~CDF~~-datamodellen. Start med å kontekstualisere dataene med maskinlæring og regelmotorer. Deretter lar du eksperter på området validere og finjustere resultatene.

Trinn 3: Utvikle løsninger

Med komplette og kontekstualiserte data kan du utvikle apper der du for eksempel kan klikke på en komponent i en 3D-modell for å vise alle de tilhørende tidsseriedataene eller be om alle trykkavlesningene langs en strømningslinje.

All informasjon lagret i ~~CDF~~, er tilgjengelig gjennom et moderne REST-basert API. I tillegg til et veldokumentert ~~API~~ tilbyr ~~Cognite~~ koblinger og SDK-er for mange vanlige programmeringsspråk og analyseverktøy, for eksempel ~~Python~~, ~~JavaScript~~, ~~Spark~~, ~~OData~~ (~~Excel~~ og ~~Power BI~~) og ~~Grafana~~. Vi tilbyr også fellesskaps-SDK-er for ~~Scala~~ og ~~.Net~~.

Du er avhengig av en godt definert datamodell for å gjøre antagelser om strukturen til dataene, for at du skal kunne utvikle apper i tillegg til dataene i ~~CDF~~.

Trinn 1: Konfigurere datastyring​

Trinn 2: Integrer data​

Trekk ut data​

Endre data​

Forbedre data​

Trinn 3: Utvikle løsninger​

Mer informasjon​