Vai al contenuto principale

Presentazione del prodotto

Questo tour del prodotto fornisce una panoramica generale dell'architettura di Cognite Data Fusion (CDF) e descrive i passaggi principali per realizzare l'implementazione.

Cognite Data Fusion (CDF) è una piattaforma per la contestualizzazione e DataOps:

  • Il processo di contestualizzazione combina la tecnologia machine learning, l'intelligenza artificiale e la conoscenza del dominio per mappare tra loro le risorse provenienti da sistemi di origine diversi nel grafico della conoscenza industriale.

  • DataOps è un set di strumenti e procedure per gestire il ciclo di vita dei dati attraverso la collaborazione e l'automazione.

Architettura

Cognite Data Fusion (CDF) viene eseguito nel cloud ed è caratterizzato da una struttura modulare.

L'architettura di CDF

È possibile interagire con i dati attraverso aree di lavoro dedicate nell'applicazione Web di CDF oppure con le API e gli SDK.

Le sezioni seguenti illustrano i passaggi principali necessari per implementare CDF e spiegano come si rapportano ai diversi moduli di CDF.

Passaggio 1: Impostazione della gestione dati

Quando si prendono decisioni, è importante sapere che i dati sono affidabili e che si può fare affidamento su di essi.

Prima di integrare e contestualizzare i dati in CDF, è necessario definire e implementare i criteri di governance dei dati. È consigliabile nominare un amministratore di CDF che collabori con il reparto IT affinché CDF segua le procedure di sicurezza dell'organizzazione. Connettere CDF al provider di identità (IdP) e utilizzare le identità utente esistenti per gestire l'accesso ai dati e agli strumenti di CDF.

Per creare applicazioni sui dati in CDF, è necessario fare affidamento su un modello di dati ben definito per avanzare ipotesi sulla struttura di dati. CDF offre modelli di dati pronti all'uso per creare un grafico della conoscenza strutturato, flessibile e contestualizzato.

Passaggio 2: Integrazione dei dati

I criteri di governance dei dati stabiliti consentono di aggiungere dati dalle origini IT, OT e ET in CDF. Queste origini dati includono sistemi di controllo industriali che forniscono dati dei sensori, sistemi ERP e modelli CAD 3D di grandi dimensioni in sistemi di ingegneria.

Estrazione dei dati

Con l'accesso in lettura alle origini dati, è possibile impostare l'integrazione di sistemi per eseguire lo streaming dei dati nell'area di gestione temporanea di CDF dove i dati possono essere normalizzati e arricchiti. Supportiamo interfacce e protocolli standard come PostgreSQL e OPC-UA per agevolare l'integrazione dei dati con strumenti ETL esistenti e soluzioni di data warehouse.

Disponiamo di strumenti di estrazione per sistemi specifici e strumenti ETL standard utilizzabili con la maggior parte dei database. Questo approccio consente di ridurre al minimo la logica negli strumenti di estrazione e di eseguire e rieseguire trasformazioni sui dati nel cloud.

Trasformazione dei dati

I dati vengono archiviati nel formato originale nell'area di CDF gestione temporanea. È possibile eseguire e rieseguire trasformazioni sui dati nel cloud e rimodellarli in base al modello di dati di CDF.

Separando i passaggi di estrazione e trasformazione si semplifica la gestione delle pipeline di dati e si riduce il carico sui sistemi di origine. È consigliabile trasformare i dati utilizzando gli strumenti ETL esistenti. Offriamo anche lo strumento Trasformazione di CDF come alternativa a processi di trasformazione leggeri.

Arricchimento dei dati

Gli strumenti di contestualizzazione automatici e interattivi in CDF consentono di combinare l'intelligenza artificiale, la tecnologia machine learning, un potente motore di regole e la conoscenza del dominio per mappare tra loro risorse di sistemi provenienti da sistemi di origine diversi nel modello di dati di CDF. Iniziare contestualizzando i dati con l'intelligenza artificiale, la tecnologia machine learning e i motori di regole, quindi lasciare che gli esperti di dominio convalidino e perfezionino i risultati.

Passaggio 3: Utilizzo dei dati e creazione di soluzioni

Con dati contestualizzati e completi nel grafico della conoscenza industriale, è possibile utilizzare gli strumenti industriali integrati e creare app potenti e agenti AI per soddisfare le esigenze aziendali.

Tutte le informazioni archiviate in CDF sono disponibili attraverso la nostra API basata su REST. Cognite fornisce anche connettori e SDK per linguaggi di programmazione comuni e strumenti di analisi come Python, JavaScript, Spark, OData (Excel, Power BI) e Grafana. Offriamo anche community SDK per Java, Scala, Rust e .Net.

Il servizio Functions offre un modo scalabile, sicuro e automatizzato per ospitare ed eseguire codice Python.