製品ツアー

この製品ツアーでは、 Cognite Data Fusion（CDF）のアーキテクチャの高レベルの概要と、実装を迅速に行うための主なステップが学べます。

Cognite Data Fusion（CDF）は、コンテキスト化とデータ操作のためのプラットフォームです。

コンテキスト化では、機械学習、人工知能、ドメイン知識を組み合わせて、産業知識グラフの中で異なるソースシステムからのリソースを相互にマッピングします。
データ操作は、コラボレーションと自動化を通じてデータのライフサイクルを管理するための一連のツールとプラクティスです。

アーキテクチャ

Cognite Data Fusion（CDF）はクラウドで動作し、モジュール式設計になっています。

~~CDF~~ Web アプリケーションの専用ワークスペース、または当社のAPI および SDK を通じて、データを操作することができます。

以下のセクションでは、CDF を実装するための主なステップと、それらがさまざまな CDF モジュールとどのように関連しているかを紹介します。

ステップ 1：データ管理を設定する

意思決定を行う際には、そのデータが信頼性のあるものであり、そのデータを信用できることが重要です。

~~CDF~~ でデータの統合やコンテキスト化を行う前に、データガバナンス ポリシーを定義し、実装する必要があります。~~CDF~~ の管理者を任命し、IT 部門と協力して、~~CDF~~ が組織のセキュリティ慣行に従うようにすることをお勧めします。~~CDF~~ を ID プロバイダー（~~IdP~~）に接続し、既存のユーザー ID を使って ~~CDF~~ ツールとデータへのアクセスを管理します。

~~CDF~~ のデータに基づいてアプリケーションを構築するには、データ構造について仮定を立てるために、明確に定義されたデータモデルに依存します。~~CDF~~ にはすぐに使えるデータモデルがあり、構造化された柔軟なコンテキスト化された 知識グラフを構築できます。

ステップ 2：データを統合する

確立されたデータガバナンスポリシーにより、IT、OT、ET のソースから CDF にデータを追加することができます。これらのデータソースには、センサーデータを供給する産業制御システム、ERP システム、エンジニアリングシステムの巨大な 3D CAD モデルが含まれます。

データを抽出する

データソースへの読み取りアクセス権があれば、~~CDF~~ ステージング領域にデータをストリーミングするようにシステム統合を設定できます。そこでデータを正規化し、強化することができます。既存の ETL ツールやデータウェアハウスソリューションとのデータ統合を容易にするため、~~PostgreSQL~~ や ~~OPC-UA~~ のような標準のプロトコルやインターフェイスをサポートしています。

特定のシステム用に作られた抽出ツールと、ほとんどのデータベースで動作する標準的な ETL ツールがあります。このアプローチでは、抽出ツール内のロジックを最小限に抑え、クラウド上のデータに対して変換を実行し、再実行することができます。

データを変換する

データは ~~CDF~~ ステージング領域にオリジナルのフォーマットで保存されています。クラウド上のデータに対して変換を実行・再実行し、~~CDF~~ データモデルに合うように形を変えることができます。

抽出ステップと変換ステップを切り離すことで、データパイプラインのメンテナンスが容易になり、ソースシステムの負荷が軽減されます。既存の ETL ツールを使用してデータを変換することをお勧めします。軽量の Transformations ジョブ用の代替ツールとして ~~CDF~~ Transformationsツールも提供しています。

データを充実させる

~~CDF~~ の自動でインタラクティブなコンテキスト化ツールを使うと、人工知能、機械学習、強力なルールエンジン、ドメインの専門知識を組み合わせて、 ~~CDF~~ データモデルの中で異なるソースシステムのリソースを相互にマッピングすることができます。人工知能、機械学習、ルールエンジンを使ってデータをコンテキスト化することから始めましょう。次に、ドメインの専門家に結果の検証と微調整をしてもらいます。

ステップ 3：データを利用してソリューションを構築する

産業知識グラフ内の完全かつコンテキスト化されたデータを利用して、内蔵の産業用ツールを使用し、ビジネスニーズに合った強力なアプリや AI エージェントを構築することができます。

~~CDF~~ に保存されたすべての情報は、REST ベースの API を通じて利用できます。~~Cognite~~ は、~~Python~~、~~JavaScript~~、~~Spark~~、~~OData~~（~~Excel~~、~~Power BI~~）、および ~~Grafana~~ など、一般的なプログラミング言語や分析ツール用のコネクタや SDK を提供しています。また、~~Java~~、~~Scala~~、~~Rust~~、および ~~.Net~~ 用のコミュニティ SDK も提供しています。

~~Functions~~ サービスは、スケーラブルで安全かつ自動化された方法で ~~Python~~ コードをホストし、実行します。

アーキテクチャ​

ステップ 1：データ管理を設定する​

ステップ 2：データを統合する​

データを抽出する​

データを変換する​

データを充実させる​

ステップ 3：データを利用してソリューションを構築する​