本記事では、Snowflakeの導入における契約・初期設定方法を、注意事項を踏まえてご紹介いたします。本記事がSnowflakeを導入する際の参考になればと思います。
「Snowflakeとは?」という方は、下記公式サイトの”他とはまったく違うプラットフォーム”を参照してください。
Snowflake AIデータクラウド | Snowflake Japan
契約形態
Snowflakeには「オンデマンド」と「プリペイドキャパシティ」の2種類の契約形態があります。
オンデマンドは使用した分だけ料金が発生する従量課金方式で、毎月の支払いが必要です。プリペイドキャパシティは前払い方式で、事前に契約した容量から毎月の使用量分が消費されます。
契約時には、上記の二つのうちどちらか一方を選択する必要があります。
なお、契約後に変更することも可能となりますが、以下の点に注意してください。
- 契約期間と条件
- プリペイドキャパシティ契約の場合、契約期間中に変更を行う際には、既存の契約条件に基づく調整が必要です
- 例えば、未使用のクレジットがある場合、その取り扱いについて確認する必要があります
- 料金の調整
- オンデマンドからプリペイドキャパシティに変更する場合、事前に支払った料金が適用されるため、クレジット単価が割引されることがあります
- 逆に、プリペイドキャパシティからオンデマンドに変更する場合は、従量課金方式に戻るため、料金体系が変わります
- 手続き
- 契約変更の手続きは、Snowflakeの管理コンソールから行うことができます
- 具体的な手順や必要な書類については、Snowflakeのサポートチームに問い合わせることをお勧めします
料金体系
Snowflakeの料金は、ウェアハウス使用料とストレージ使用料で構成されます。
ウェアハウス使用料は、仮想ウェアハウスのサイズと稼働時間に基づいてクレジットが消費されます。ストレージ使用料は、保存データの容量に基づいて計算されます。
契約前に利用予定を試算し、最適なプランを選ぶことが重要です。
エディションの選択
Snowflakeにはスタンダード、エンタープライズ、ビジネスクリティカル、バーチャルプライベートSnowflake (VPS)の4つのエディションがあります。
各エディションは提供される機能やサポートが異なるため、自社のニーズに合ったエディションを選択することが必要です。
以下、それぞれのエディションについて概要を説明します。
- スタンダード
- 基本的なデータウェアハウス機能を提供し、コストと機能のバランスが取れた入門レベル
- 標準的なセキュリティとサポートを含みます
- エンタープライズ
- スタンダードの全機能に加え、マルチクラスターウェアハウスや90日間のTime Travel、動的データマスキングなどの高度な機能を提供します
- ビジネスクリティカル
- エンタープライズの全機能に加え、HIPAAやPCI DSSのコンプライアンス対応、フェイルオーバー/フェイルバック機能、顧客管理の暗号化キーをサポートします
- バーチャルプライベートSnowflake (VPS)
- ビジネスクリティカルの全機能に加え、専用のメタデータストアとコンピューティングリソースを提供し、最高レベルのセキュリティを実現します
セキュリティとコンプライアンス
Snowflakeを利用する際には、セキュリティとコンプライアンスの要件を確認することが重要です。特に、PHIデータ*1を保存する場合は、Snowflake Incとのビジネスアソシエイト契約(BAA)を締結する必要があります。
初期設定
Snowflakeを契約後、はじめに行うべき操作について触れていきます。
※ クラウド(Azure、AWS、GCP)の選択はアカウント作成時に行います。
以下、設定項目の概要を記載します。
- アカウント設定
- Snowflakeアカウントを作成し、エディションを選択します
- エディションによって利用できる機能が異なるため、ニーズに合ったものを選びましょう
- ユーザーとロールの作成
- ユーザーごとにアカウントを作成し、アクセス制御のために適切なロール(権限)を割り当てます
- 初期設定では、ACCOUNTADMIN、SECURITYADMIN、SYSADMINなどのシステムロールを利用します
- ウェアハウスの作成
- クエリの処理に使用する仮想ウェアハウスを作成します
- ウェアハウスのサイズや自動一時停止設定を行い、コスト効率を高めます
- 利用しない時間帯は停止をすることで利用料を削減することができます
- データベースとスキーマの作成
- データを格納するためのデータベースとスキーマを作成します
- これにより、データの整理と管理が容易になります
- ネットワークポリシーの設定:
- セキュリティを強化するために、接続を許可するIPアドレスを制限するネットワークポリシーを設定します
- タイムゾーンの設定
- デフォルトのタイムゾーンを変更し、業務に合わせた時間設定を行います
- 日本標準時に変更する場合は、
ALTER ACCOUNT SET TIMEZONE = 'Asia/Tokyo';
を実行します。
- リソースモニターの設定:
- クレジット使用量を監視するためのリソースモニターを設定し、コスト管理を行います
- 使用量に応じた通知や自動停止設定を行うことで、無駄なコストを防ぎます
おわりに
契約の前には事前に確認する項目があります。Snowflakeの導入に際して、目的を明確にし、それに合わせて契約をする必要があります。
また、設定に関しても導入時に設定をしておいたほうがよい項目があるため、本記事に記載した内容が参考になれば幸いです。
*1:PHI(Protected Health Information)データとは、個人の健康情報を指します。具体的には、氏名、住所、生年月日、病歴、診断結果、治療内容、検査結果、医療費の支払い情報など、個人を特定できる医療関連の情報が含まれます。
土山 和也(日本ビジネスシステムズ株式会社)
ユーザーサポート、開発、運用、構築業務を経験し、現在はアーキテクトとして提案・プロジェクト支援に従事。専門はデータベースでDBA歴十数年。Azure/AWSを担当。
担当記事一覧