こんにちは。
日本ビジネスシステムズ株式会社の岩間です。
今回はSnowflake上でMarketplace機能を用いてサードパーティー製のデータを取得する方法を紹介します。
Snowflakeをご利用中の方だけでなくSnowflakeの導入を検討中の方もぜひ、いかに手軽にサードパーティー製データを利用できるかというところをご覧いただければと思います。
※今回利用しているSnowflakeのトライアルアカウントはリージョンが「AWS Asia / Pacific (Tokyo)」、エディションが「エンタープライズ」になります。
Snowflake Marketplaceについて
Snowflake Marketplaceは、各アカウントが自前のデータを他の複数アカウントに公開(無償/有償)したり、あるいは他のアカウントが公開しているデータを利用することができるようになるサービスです。
このサービスを使うことで、データを利用する側としてはすべてのデータを自前で用意する必要がなくなったり、ちょっとしたテストのためのサンプルデータをすぐに取得することができます。
一方で、データを公開する側はこのサービスでデータを売ってマネタイズすることもできます。
今回はこのサービスで公開されているCOVID-19のデータ(無償)を取得してみたいと思います。
Snowflake Marketplaceからのデータ取得手順
Marketplaceからデータを取得
1. 画面左ペインの「Marketplace」をクリックして、Most Popularの欄に出ている「COVID-19 Epidemiological Data」をクリック ※表示されていない場合は画面上部の検索ボックスで検索してください。
2. 画面右側の「Get」をクリック
3. ポップアップが表示されるので、「Get」をクリック
4. ポップアップが表示されるので、「Done」をクリック
データの取得を確認
1. 画面左ペイン「Data」をクリックして、「Databases」をクリック。右側に「COVID19_EPIDEMIOLOGICAL_DATA」が表示されていることを確認
2. SQLワークシートを用意して以下クエリを実行
select * from COVID19_EPIDEMIOLOGICAL_DATA.PUBLIC.WHO_TIMESERIES where CASES_TOTAL >= 2000000;
※以下のような内容が画面下部に表示されればデータ取得できています。
さいごに
以上がMarketplaceからデータを取得する手順の流れとなります。
今後もSnowflakeの魅力を伝える記事を書いていく予定なので、ぜひそちらもご一読ください!