【Azure Data Factory】セルフホステッド統合ランタイムを構成する

Azure Data Factory とは、Microsoft Azure のクラウドベースのデータ統合サービスで、様々なデータソースからデータの抽出や変換、異なるデータストアへのロード等を行うことが可能です。

Azure Data Factory には 3 種類の統合ランタイムが用意されており、利用するデータやネットワーク環境に合わせて統合ランタイムを選択します。

今回は、クラウドデータストアとプライベートネットワーク内のデータストア間でコピーが可能となる、セルフホステッド統合ランタイムのプロビジョニングを行ってみたいと思います。

セルフホステッド統合ランタイムでのデータフロー概要

オンプレミスとクラウドの間でデータを移動する場合、セルフホステッド統合ランタイムを使用して、オンプレミス データ ソースとクラウドの間でデータを転送します。

セルフホステッド統合ランタイムでコピーするデータ フロー手順の概要
セルフホステッド統合ランタイムでコピーするデータ フロー手順の概要(出典:自己ホスト型統合ランタイムを作成する - Azure Data Factory & Azure Synapse | Microsoft Learn

セルフホステッド統合ランタイムの構築手順

Azure Data Factory にランタイムを追加する

Azure Data Factory Studio > Manage > Integration runtimes > 新規 よりランタイムの追加を行います。

統合ランタイムを追加する
統合ランタイムを追加する

統合ランタイムのセットアップ画面で「セルフホステッド」を選択します。

セルフホステッド統合ランタイムを追加する
セルフホステッド統合ランタイムを追加する

設定画面で任意のランタイム名を入力し作成ボタンを押下すると、ランタイムが作成されます。

セルフホステッド統合ランタイム確認画面
セルフホステッド統合ランタイム確認画面

インストーラーを入手する

セルフホステッド統合ランタイム確認画面に下記 2 種類のインストーラーのリンクが表示されます。

  • 高速セットアップ

認証キーの入力が不要でインストールを行うと Azure Data Factory に追加したランタイムへのセットアップが自動で行われます。

  • 手動セットアップ

Microsoft のダウンロードセンターより任意のインストーラーを取得し、手動で設定を行います。

今回は手動セットアップの手順を行います。

高速セットアップの場合でも手順の流れに大きな違いはありません。

インストール

セルフホステッド統合ランタイムは、オンプレミスのマシンか、プライベート ネットワーク内の仮想マシンにインストールを行います。 システム要件は下記となります。

  • サポートされるオペレーティング システム

Windows Server 2019, Windows Server 2016, Windows 10, Windows Server 2012 R2, Windows Server 2012, Windows 8.1, Windows 11, Windows Server 2022

Microsoft Integration Runtime (セルフホステッド) には .NET Framework 4.7.2 以上が必要です。統合ランタイム (セルフホステッド) マシンの推奨構成は、最低でも 2 GHz、4 コア、8 GB RAM、80 GB のディスクです。

www.microsoft.com

セルフホステッド統合ランタイムをインストールします。

使用許諾契約やインストール先フォルダ等、表示に従い設定を進めインストールを完了させます。

セルフホステッド統合ランタイムインストール画面
セルフホステッド統合ランタイムインストール画面

インストールが完了するとインストール端末のインジケーターにセルフホステッド統合ランタイムのアイコンが表示されます。

インジケーター
インジケーター

アイコンから設定画面を開き、セルフホステッド統合ランタイム確認画面で発行された認証キーを入力します。

認証キー設定
認証キー設定

登録ボタンを押下し、セルフホステッド統合ランタイムが Azure Data Factory と接続されたことを確認します。

接続確認
接続確認

ランタイムの状態を確認する

セットアップが正常に完了するとランタイムが使用可能になります。 Azure Data Factory Studio で状態が「実行中」となっていることを確認します。

ランタイムの状態
ランタイムの状態

セルフホステッド統合ランタイムを使用する

リンクサービス等からランタイムを選択し、データソースとの接続を行います。

これで Azure Data Factory Studio の Pipeline やデータフローから接続したデータソースとの処理を行うことができます。

リンクサービスでセルフホステッド統合ランタイムを使用する
リンクサービスでセルフホステッド統合ランタイムを使用する

おわりに

業務で Azure Data Factory を使用することがあり、自分の忘備録的な意味も含めて記事を作成しました。

この記事が参考になれば幸いです。

執筆担当者プロフィール
石橋 侑樹

石橋 侑樹(日本ビジネスシステムズ株式会社)

これまで業務システムやWebアプリの開発、業務自動化等に携わってきました。サッカーが好きで休日は試合を見ていることが多いです。

担当記事一覧