メイン コンテンツにスキップする

データガバナンス

Cognite Data FusionCDF)でデータの統合や拡張を始める前に、データ ガバナンス ポリシーを定義し、実装する必要があります。データガバナンスとは、データのライフサイクルを通じて高品質を保証する一連の原則と実践のことです。データ管理の実践を継続的に最適化することは、データ運用の重要な部分です。

CDF の管理者を任命し、IT 部門と協力して、CDF が組織のセキュリティ慣行に従うようにすることをお勧めします。また、CDF を IdP(ID プロバイダー)に接続し、既存の IdP ユーザー ID を使って CDFCDF に保存されているデータへのアクセスを管理します。現在、Microsoft'sMicrosoft Entra ID (formerly Azure Active Directory をサポートしています。

このユニットでは、データがお客様の組織とユーザーの期待に適合していることを確認するために使用できる CDF ツールと機能について説明します。

安全なアクセス管理

CDF のデータへのアクセスを制御するには、ユーザーやアプリケーションが CDF のさまざまなリソース タイプでどのような機能を使用できるかを定義します。たとえば、_時系列を読む_や、_アセットを削除する_などです。

グループ

個々のユーザーやアプリケーションに機能を割り当てる代わりに、CDF ではグループを使って、メンバー(ユーザーやアプリケーション)にさまざまな CDF リソースを操作するためにどのような機能を持たせるかを定義することができます。CDF グループを ID プロバイダー(IdP)、たとえば Microsoft Entra ID (ME-ID) のユーザーグループにリンクして同期します。

たとえば、ユーザーやアプリケーションに CDF の時系列データの_読み取り_はさせたい一方で、_書き込み_はさせたくない場合、まず IdP でグループを作成し、関連するユーザーやアプリケーションを追加します。次に、必要な機能を持つ CDF グループを作成し、CDF グループと IdP グループをリンクします。

この柔軟性により、データガバナンスポリシーを迅速かつ安全に管理および更新することができます。CDF の外でも、組織の IdP サービスでユーザーとアプリケーションの管理を続けることができます。

データの系統と整合性

業務上の意思決定をデータに依存する場合、データがいつ信頼できるかを把握することと、エンドユーザーの側では、意思決定にデータを利用できるタイミングを知ることが重要です。CDF には、データが組織やユーザーの期待に沿うようにするためのツールや機能があります。

データ セット

データ セットによって、データの系統をドキュメント化して追跡し、データの整合性を確保することができ、サードパーティは自分の洞察を CDF プロジェクトに安全に書き戻すことができます。データの出所と担当者を常に把握できるように、CDFすべてのデータをデータセットで整理することをお勧めします。

データセットは、データをソース別にグループ化し、追跡します。たとえば、データ セットには SAP から発信されたすべての作業指示を含めることができます。通常、組織は CDF のデータ取り込みパイプラインごとに 1 つのデータ セットを持つことになります。CDF の各データ オブジェクトは、1 つのデータ セットにしか属しません。

データセットはデータオブジェクトのコンテナであり、そこに含まれているデータに関するメタデータを持ちます。たとえば、データセットのメタデータを使用して、データの担当者をドキュメント化したり、ドキュメントファイルをアップロードしたり、データの系統を記述したりできます。CDF では、データ セットは別のリソース タイプです。

データセット

通常、データ取り込みパイプラインでは、どのデータオブジェクト(イベント、ファイル、時系列など)がデータセットに属するかをプログラムで定義します。データオブジェクトは 1 つのデータセットにしか属さないので、各データオブジェクトのデータの系統を明確にたどることができます。

詳細情報