【第1回】Microsoft Purviewって何?

仕事でMicrosoft Purviewを使う事になったので、構築までの道のりを備忘録的にまとめていこうと思います。

第一回は、「Microsoft Purviewって何?」といったところから始めようと思います。

Microsoft Purviewとは?

Microsoft Purviewの主要システムは、もともと「Azure Purview」という名称で呼ばれていました。

そこに、Microsoft 365の「コンプライアンスセンター」が統合され、「Microsoft Purview」となりました。

ちなみに、Microsoft 365 管理センターに表示されていた「コンプライアンスセンター」は、現在「Microsoft Purview コンプライアンス ポータル」という名称に変わっています。

(今回は、コンプライアンスセンターに関する説明はいたしません)

 

Microsoft Purviewとは、Azure上にあるデータやオンプレミスにあるデータをスキャンし、データカタログを自動的に作ってくれるサービスです。また、機密性のあるデータの場合に自動的に分類してもくれます。

作成したデータカタログを公開する事で、何のデータがどこにあるのかを皆が検索する事ができます。

これにより、作成するデータの重複や、似たシステムの乱立、などを避ける事ができます。

 

とはいえ、誰でもデータの中身まで見られる状況は困ります。ですので、Microsoft Purviewでは、保存場所、タイトル、所有者、カラム、ファイルの説明、などのメタデータのみを公開する事で、「誰でもデータ検索ができ、その中から必要な人(許可された人)だけがデータ活用できる」という状況を作り出してくれます。

 

図書館にある蔵書検索システムを使ったことがあると思います。

システムを利用して本を探すとき、本の中身は見ずに、書名や著者名、出版者、分類、書誌の種別、出版年度などから検索しますよね。それが、「メタデータを利用した検索」です。

また、蔵書リストが「データカタログ」になります。

期待される効果

期待される効果として最も大きいものは、「社内でのデータ活用が促進される」ということでしょう。

データソースとのリンク・Microsoft Purviewへのメタデータが容易に登録ができることで、データを活用を試みる人のデータ検索が容易になります。その結果、データの利活用が進み、無駄なシステム投資やデータの散逸を防ぐことができ、データを確実に「社内資産」として位置付ける事ができます。

どんなサービスと連携できる?

Docsでは、Azureにある、下記サービスと連携する事ができると記載されていました。

  • Azure Blob Storage
  • Azure Cosmos DB
  • Azure Data Explorer
  • Azure Data Lake Storage Gen1
  • Azure Data Lake Storage Gen2
  • Azure SQL Database
  • Azure SQL Database Managed Instance
  • Azure Synapse Analytics
  • Power BI
  • SQL Server

Azure以外では、下記サービスとの連携ができるようです。

  • Cassandra
  • Db2
  • Erwin
  • Google BigQuery
  • HDFS
  • Hive メタストア データベース
  • Looker
  • MongoDB
  • MySQL
  • オンプレミスの SQL Server
  • Oracle
  • PostgreSQL
  • Salesforce
  • SAP Business Warehouse
  • SAP ECC
  • SAP HANA
  • SAP S/4HANA
  • Snowflake
  • Teradata
  • Amazon RDS
  • Amazon S3

サービス連携の使い勝手はかなり良さそうです。

どんなデータ形式が利用できる?

利用できるデータ形式は決まっています。現在は下記のデータ形式が利用できます。

AVRO, CSV, DOC, DOCM, DOCX, DOT, JSON, ODP, ODS, ODT, ORC, PARQUET, PDF, POT, PPS, PPSX, PPT, PPTM, PPTX, PSV, SSV, TSV, TXT, XLC, XLS, XLSB, XLSM, XLSX, XLT, XML

費用について

費用の試算は「https://learn.microsoft.com/ja-jp/azure/purview/concept-guidelines-pricing」のサイトで調べる事ができます。

learn.microsoft.com

また、「料金計算ツール(https://azure.microsoft.com/ja-jp/pricing/calculator/)」サイトで、「分析>Microsoft Purview」と選べば簡易的ではありますが、見積もり計算もできます。

azure.microsoft.com

 

価格概念は大きく分けて、「直接コスト」と「間接コスト」があります。

直接コストは、「Microsoft Purview Data Map」を利用するための料金と、「Data Estate Insights」を利用するための料金です。「Microsoft Purview Data Map」はデータ検索のため用いるサービスで、「Data Estate Insights」はデータ資産の正常性とガバナンスの状態を分析するために用いるサービスです。

 

直接コストを知るうえで重要なポイントは、「容量ユニット(CU)」という考え方です。

Microsoft Purviewは、従量課金制となっており、その単位が「容量ユニット(CU)」となります。1容量ユニットに対して、25 操作/秒のスループットと 10 GB のメタデータ ストレージが利用できます。それを超えると、自動的にユニットの拡張が行われ、費用が増加する事になります。これらについて記載されているサイトがありますので、確認する事をおすすめします。

learn.microsoft.com

ちなみに、利用状況はPurviewアカウントのサイトでも確認できます。

 

間接コストは、プライベートリンク、Microsoft365、通知システムなどの利用を希望する場合に発生する料金です。

コストの目安についてもサイトで紹介されていますので、参考にしてみてください。

おわりに

以上で、「【第1回】Microsoft Purviewって何?」の説明を終わります。

次回は、Microsoft Purviewの機能について詳しく見ていきたいと思います。

執筆担当者プロフィール
酒主 健吾

酒主 健吾(日本ビジネスシステムズ株式会社)

エキスパート職として在籍。Viva Insghtsを活用したオンボーディング分析を担当。

担当記事一覧