Presentazione del prodotto
Questo tour del prodotto fornisce una panoramica generale dell'architettura di Cognite Data Fusion (CDF) e descrive i passaggi principali per realizzare l'implementazione.
Cognite Data Fusion (CDF) è una piattaforma per la contestualizzazione e DataOps:
-
Il processo di contestualizzazione combina la tecnologia machine learning, l'intelligenza artificiale e la conoscenza del dominio per mappare tra loro le risorse provenienti da sistemi di origine diversi nel grafico della conoscenza industriale.
-
DataOps è un set di strumenti e procedure per gestire il ciclo di vita dei dati attraverso la collaborazione e l'automazione.
Architettura
Cognite Data Fusion (CDF) viene eseguito nel cloud ed è caratterizzato da una struttura modulare.
L'utente può interagire con i propri dati attraverso aree di lavoro dedicate nell'applicazione Web di CDF o con le nostre API ed SDK.
Le sezioni seguenti illustrano i passaggi principali necessari per implementare CDF e spiegano come si rapportano ai diversi moduli di CDF.
Passaggio 1: impostazione della gestione dati
Quando si prendono decisioni, è importante sapere che i dati sono affidabili e che si può fare affidamento su di essi.
Prima di integrare e contestualizzare i dati in CDF, è necessario definire e implementare i criteri di governance dei dati. È consigliabile nominare un amministratore di CDF che collabori con il reparto IT affinché CDF segua le procedure di sicurezza dell'organizzazione. Connettere CDF al provider di identità (IdP), e utilizzare le identità utente esistenti per gestire l'accesso ai dati e agli strumenti di CDF.
Per creare applicazioni sui dati in CDF, è necessario disporre di un modello dati ben definito per avanzare ipotesi sulla struttura dei dati. CDF offre modelli dati predefiniti per creare un grafico della conoscenza.
Passaggio 2: integrazione dei dati
I criteri di governance dei dati stabiliti consentono di aggiungere dati dalle origini IT, OT e ET in CDF. Queste origini dati includono sistemi di controllo industriali che forniscono dati dei sensori, sistemi ERP e modelli CAD 3D di grandi dimensioni in sistemi di ingegneria.
Estrazione dei dati
Con l'accesso in lettura alle origini dati, è possibile impostare l'integrazione di sistemi per eseguire lo streaming dei dati nell'area di gestione temporanea di ~~CDF ~~dove i dati possono essere normalizzati e arricchiti. Supportiamo le interfacce e i protocolli standard come PostgreSQL e OPC-UA per agevolare l'integrazione dei dati con strumenti ETL esistenti e soluzioni di data warehouse.
Disponiamo di strumenti di estrazione per sistemi specifici e strumenti ETL standard utilizzabili con la maggior parte dei database. Questo approccio consente di ridurre al minimo la logica negli strumenti di estrazione e di eseguire e rieseguire trasformazioni sui dati nel cloud.
Trasformazione dei dati
I dati vengono archiviati nel formato originale nell'area di gestione temporanea di CDF. È possibile eseguire e rieseguire trasformazioni sui dati nel cloud e rimodellarli in base al modello di dati di CDF.
Separando i passaggi di estrazione e trasformazione si semplifica la gestione delle pipeline di dati e si riduce il carico sui sistemi di origine. È consigliabile trasformare i dati utilizzando gli strumenti ETL esistenti. Offriamo anche lo strumento CDF Transformations come alternativa a processi di trasformazione leggeri.
Arricchimento dei dati
Gli strumenti di contestualizzazione automatici e interattivi in CDF consentono di combinare l'intelligenza artificiale, la tecnologia machine learning, un potente motore di regole e la conoscenza del dominio per mappare tra loro risorse di sistemi provenienti da sistemi di origine diversi nel modello di dati di CDF. Iniziare contestualizzando i dati con l'intelligenza artificiale, la tecnologia machine learning e i motori di regole, quindi lasciare che gli esperti di dominio convalidino e perfezionino i risultati.
Passaggio 3: utilizzo dei dati e creazione di soluzioni
Con dati contestualizzati e completi nel grafico della conoscenza industriale, è possibile utilizzare gli strumenti industriali integrati e creare app potenti e agenti AI per soddisfare le esigenze aziendali.
Tutte le informazioni archiviate in CDF sono disponibili attraverso la nostra API basata su REST. Cognite fornisce inoltre connettori ed SDK per i linguaggi di programmazione comuni e strumenti di analisi come Python, JavaScript, Spark, OData (Excel, Power BI) e Grafana. Offriamo anche community SDK per Java, Scala, Rust e .Net.
Il servizio Functions offre un modo scalabile, sicuro e automatizzato per ospitare ed eseguire codice Python.