オープンデータを利用して Microsoft Fabric を利用してみる

Microsoft Fabric は、Microsoft のサービスで、SaaS 型のデータ分析基盤です。SaaS 型のため、容易にデータ分析の一連の流れを試すことができる特徴があります。

今回は、まずは Microsoft Fabric を体験してみることを目的に、オープンデータを使ってレポートを作成するまでの流れを解説します。

データソースの準備

今回は、e-Goveで提供されているオープンデータを利用します。

トップ | e-Govデータポータル

ここから、24時間降水量 (pre24h00_rct.csv)をダウンロードします。

データセット | e-Govデータポータル

ダウンロードCSVファイルをExcelで開き、Excelブック(.xlsx)として保存します。

データソースの取り込み

Microsoft Fabric の環境へアクセスし、「作成」から「レイクハウス」を選択します。

任意の名前をつけ、「作成」を押下します。

作成が完了すると下記の画面に遷移します。

Files の右にあるメニューから、「アップロード」 > 「ファイルのアップロード」の順に選択します。

事前に準備したファイルを選択し、「アップロード」を押下します。

ファイルがアップロードされていることが確認できます。

ウェアハウスの作成

本記事では、レイクハウスからデータコピーを実施し、ウェアハウスを自動作成します。

「作成」から「すべて表示」を押下します。

Data Factory まで画面遷移し、「データパイプライン」を選択します。

任意の名前を付け、「作成」を押下します。

「データのコピー」から「キャンバスに追加」を選択します。

データのコピーが選択されている状態で、「ソース」を下図のように設定をします。

ソースは先ほど作成したレイクハウスを指定しています。

ファイル形式の「設定」を押下します。

先頭行をヘッダーとしてにチェックを入れ、「OK」を押下します。

続いて、「宛先」の設定をします。

宛先にはここで新規作成をするウェアハウスを指定します。

接続から「詳細」を押下します。

「ウェアハウス」を押下し、任意の名前を入力し、「作成して接続」を押下します。

下図のように「宛先」を設定します。スキーマ名とテーブル名は任意です。

続いて、「マップ」の設定をします。

「マップ」から「スキーマのインポート」を押下します。

下図のように「ソース」と「宛先」が自動で補完されます。

設定が完了したら変更を保存し、「実行」を押下します。

正常終了すると下図のような画面になります。

※ もし失敗した場合は、データのコピーの設定を見直してみてください

My Workspaceから作成したウェアハウスを押下します。

ウェアハウスにスキーマとテーブルが作成されていることが確認できます。

作成したテーブルの右メニューから、「既存のセマンティックモデルに追加」を押下します。

以上でレポート用のデータソースの準備が完了です。

レポートの作成

レポートは、手動で作成することもできますが、 Microsoft Fabric では自動で作成することもできます。今回は自動作成機能を利用してレポートを作成します。

「作成」から「公開されたセマンティックモデルを選択します」を押下します。

先ほど作成した 「pre24h00_rct_WH」 を選択し、「レポートを自動作成する」を押下します。

レポートの自動作成結果です。

無事、レポートが作成できました。

まとめ

本記事では、オープンデータを用いて Microsoft Fabric を試してみました。

これをもとに、データソースの変更やパイプライン中のデータ操作、分析の目的に合わせて複雑なレポートを手動で作成してみたりと、いろいろな機能を試すことができそうです。

執筆担当者プロフィール
宮﨑 良貴

宮﨑 良貴(日本ビジネスシステムズ株式会社)

クラウドソリューション事業部所属。ビジネスインテリジェンスツール系の技術を扱うことが多いです。エンジョイゴルファー。

担当記事一覧