データガバナンスとは、組織内のデータ管理を効果的に行うためのフレームワークやプロセスのことで、
データの収集、保存、処理、保護、共有など、データライフサイクル全体にわたって適用されます。
データガバナンスの目的は、データをより責任ある方法で管理し、データの品質、信頼性、セキュリティを確保することにあり、組織は、意思決定のための正確かつ信頼性の高いデータに基づくことができるようになり、規制や法的要件を遵守することができます。
データガバナンスを実現するクラウドサービスには何があるのかしら?
代表的なクラウドサービスについて見てみよう!
AWS
AWS Lake Formation
データレイクを作成するためのサービスで、データのセキュリティ、アクセス制御などを比較的簡単に実現できる。
AWS Glue Data Catalog
データのメタデータを一元管理するカタログで、データの位置、定義、アクセス権限などを管理できる。
Amazon DataZone
組織の境界を越えて大規模にデータを共有、検索、発見することができる。
ガバナンスとコンプライアンスのポリシーを適用しながら、すべてのデータのパーソナライズされたビューを示す統合データ分析ポータルを通じて、データプロジェクトで共同作業を行うことができる。
Azure
Azure Purview
データカタログとデータガバナンスサービスで、データの可視性、データの品質管理、アクセス制御を簡単に実現できる。
Azure Information Protection
機密データを分類、保護、共有するためのサービスで、機密情報の検出、分類、保護、監査、管理を実現できる。
GCP
Cloud Data Catalog
データのメタデータ管理サービスで、データの説明、タグ付け、分類、検索を簡単に実現できる。
Cloud Data Loss Prevention
機密情報の検出、分類、保護を実現するサービスで、機密情報の漏洩を防止することができる。
まとめ
さっと見た限りでも、クラウドサービスそれぞれで名称は若干違えど、同じようなサービスは存在するようです。
実装方法についても今後少しずつ見ていこうと思います。