제품 둘러보기
이 제품 둘러보기에서는 Cognite Data Fusion(CDF) 아키텍처와 구현을 빠르게 진행하기 위한 주요 단계에 대한 개요를 제공합니다.
Cognite Data Fusion(CDF)은 컨텍스트화와 DataOps를 위한 플랫폼입니다.
-
컨텍스트화는 머신 러닝, 인공지능 및 전문 분야 지식을 결합하여 다양한 원본 시스템의 리소스를 산업 지식 그래프에서 서로에게 매핑시킵니다.
-
DataOps는 협업과 자동화를 통해 데이터 수명 주기를 관리하기 위한 도구와 관행의 집합입니다.
아키텍처
Cognite Data Fusion(CDF)은 클라우드에서 실행되며 모듈식 설계를 사용합니다.
CDF 웹 응용 프로그램의 전용 작업 공간을 통해 또는 당사의 API 및 SDK를 사용하여 데이터와 상호 작용할 수 있습니다.
다음 섹션에서는 CDF를 구현하는 기본 단계와 이러한 단계가 다른 CDF 모듈과 어떤 관계에 있는지 소개합니다.
1단계: 데이터 관리 설정
의사 결정을 내릴 때는 데이터를 신뢰할 수 있는지, 그리고 데이터의 신뢰성을 파악할 수 있는지 아는 것이 중요합니다.
CDF에서 데이터를 통합하고 컨텍스트화하려면 먼저 데이터 거버넌스 정책을 정의하고 구현해야 합니다. IT 부서와 함께 작업하여 CDF가 조직의 보안 실무를 따르도록 보장하는 CDF 관리자를 지정하는 것이 좋습니다. 또한 CDF를 ID 공급자(IdP)에 연결하고 기존 사용자 ID를 사용하여 CDF 도구 및 데이터에 대한 액세스를 관리합니다.
CDF의 데이터에 기반하는 응용 프로그램을 구축하려면 데이터 구조에 대해 가정할 수 있는 잘 정의된 데이터 모델이 필요합니다. CDF에는 구조화되고 유연하며 컨텍스트화된 지식 그래프를 구축할 수 있는 데이터 모델이 기본 제공됩니다.
2단계: 데이터 통합
데이터 거버넌스 정책을 수립하면 IT, OT 및 ET 소스에서 CDF로 데이터를 추가할 수 있습니다. 이러한 데이터 소스에는 센서 데이터를 제공하는 산업 제어 시스템, ERP 시스템, 엔지니어링 시스템의 대규모 3D CAD 모델 등이 포함됩니다.
데이터 추출
데이터 원본에 대한 읽기 액세스 권한이 있으면 시스템 통합을 설정하여 데이터를 CDF 스테이징 영역으로 스트리밍할 수 있으며, 이 스테이징 영역에서 데이터를 정규화하고 보강할 수 있습니다. Cognite는 PostgreSQL 및 OPC-UA 같은 표준 프로토콜 및 인터페이스를 지원하므로 기존 ETL 도구 및 데이터 웨어하우스 솔루션과의 데이터 통합이 용이합니다.
또한 특정 시스템용으로 만들어진 추출기와 대부분의 데이터베이스에서 작동하는 표준 ETL 도구를 제공합니다. 이 방식을 통해 추출기의 논리를 최소화하고 클라우드에서 데이터에 대한 변환을 실행 및 재실행할 수 있습니다.
데이터 변환
CDF 스테이징 영역에서는 데이터가 원래 형식으로 저장됩니다. 클라우드에서 데이터에 대한 변환을 실행 및 재실행할 수 있으며 데이터의 형태를 CDF 데이터 모델에 맞게 변경할 수 있습니다.
추출과 변환 단계를 분리함으로써 데이터 파이프라인을 더 쉽게 유지 관리할 수 있게 만들고 원본 시스템의 부하를 줄일 수 있습니다. 기존 ETL 도구를 사용하여 데이터를 변환하는 것이 좋습니다. 또한 가벼운 변환 작업을 위한 대안으로 CDF 변환 도구도 제공합니다.
데이터 향상
CDF의 자동화된 대화형 컨텍스트화 도구를 사용하면 인공지능, 머신 러닝, 강력한 규칙 엔진 및 전문 분야 지식을 결합하여 다양한 원본 시스템의 리소스를 CDF 데이터 모델에서 서로에게 매핑시킬 수 있습니다. 인공지능, 머신 러닝 및 규칙 엔진을 사용하여 데이터를 컨텍스트화하는 것으로 시작한 다음, 분야별 전문가가 결과를 확인하고 세밀하게 조정합니다.
3단계: 데이터 사용 및 솔루션 구축
산업 지식 그래프에 있는 완전하고 컨텍스트화된 데이터를 통해 기본 제공 산업 도구를 사용할 수 있으며 비즈니스 요구 사항을 충족하는 강력한 앱과 AI 에이전트를 구축할 수 있습니다.
CDF에 저장된 모든 정보는 당사의 REST 기반 API를 통해 사용할 수 있습니다. Cognite는 Python, JavaScript, Spark, OData(Excel, Power BI), Grafana 등과 같은 많은 유명한 프로그래밍 언어와 분석 도구를 위한 커넥터 및 SDK를 제공합니다. 또한 Java, Scala, Rust, .Net을 위한 커뮤니티 SDK도 제공합니다.
Functions 서비스는 Python 코드를 호스팅하고 실행할 수 있는 확장 가능하고 안전하며 자동화된 방법을 제공합니다.