Data&AI事業本部所属の谷尾です。
2025年6月2日~6月5日にアメリカサンフランシスコで行われてるSnowflake Summitの現地レポートを発信します。こちらの記事では、3日目の様子をお届けします。
Day1とDay2について
Day1およびDay2の様子についてもレポートしておりますので、下記リンクからご確認ください。
Day1の様子
Day2の様子
参加セッション情報
本日参加したセッションの内、いくつかPickupしたセッションの概要を共有します。
How Capital One Uses Apache iceberg to Optimize Loading and Storage
Apache Icebergは、オープンソースの高性能テーブルフォーマットのことです。
Snowflake Apache Icebergでは、外部ストレージ(例:S3やAzure Blob)を使用し、内部カタログまたは外部カタログ(AWS Glueなど)経由でIcebergテーブルを管理でき、パフォーマンスについてもNativeテーブルに近い水準です。
Capital Oneは、アメリカを代表する大手金融機関の一つです。本セッションでは、Capital OneがIcebergを使って、どのようにデータ取込とストレージコストを効率化したのかについて解説されました。
Capital Oneは、これまでSnowflakeとDataLakeの両方にデータを保持する形をとっていました。構造化データはSnowflakeへ、構造化および半構造化、非構造化データをDataLakeへ保存する形をとっていたため、以下のように3つの課題を抱えていました。
- Duplicate Costs(重複コスト)
- Data Disparity(データの不整合)
- Lack of Tool Flexibility(ツールの柔軟性欠如)
ストレージが2系統存在していたため、計算や保存、管理にかかる費用が単純に2重に発生していました。
そこで、Lakehouse + Icebergによって、二重管理構成となっていたアーキテクチャを1つに統合し、最大45%のストレージコスト削減と20%のロードコンピュートが削減できることがわかったと説明がありました。
Snowflake Apache Icebergについては、下記のリンクをご参照ください。
https://docs.snowflake.com/en/user-guide/tables-iceberg
What’s New: Advanced Analytics with Cortex AISQL, Native Semantic Views, and More
このセッションでは、日本時間6/3(火)のKeynoteにて、発表されたCortex AISQLについての説明とDemoの紹介がされました。
AISQLとは、Snowflakeが提供するAI統合型のSQLエンジンで、構造化データと非構造化データ(テキスト・画像・音声)をSQLだけで処理・分析できるようにする新機能です。
各公開状況については、下記のリンクより確認いただけます。
セッションでは、実際にテーブルに格納された画像を元に、AI関数の"AI_FILTER"を使用し、画像の内容に基づいた条件抽出(フィルタリング)するDemoが行われました。
Cortex AISQLは、構造化・非構造化データをSQLだけで一貫して分析できる世界を実現します。AIによる高度なデータ活用を誰でもできる未来が近いと感じました。
会場の雰囲気
Keynote
WHOOP 事例紹介
ランチ
Chicken Salad
ハンズオンの様子
Deploying Data Pipelines with Snowflake and dbt Labs, DE206_開始前の様子
会場周辺
コーヒートラックのドーナツとドリンク
Keynoteについて
本日は、Builders Keynoteが開催されました。
このセッションでは、開発者向けに各社の成功事例や新機能のデモが紹介され、特にAIが中心的なテーマとなっていました。
中でも、これまでの開発ライフサイクルに「Architecture(設計)」という新たな概念が加わることが取り上げられました。
- Semantic Models in Cortex Analyst
- Streamlit/Notebook/Workspaces
- Apache Icebergの対応可能データ型追加
- Age of AI Inference
Keynote内で発表された内容の詳細については、下記リンクよりご覧いただけますが、それぞれについて少し補足します。
Semantic Models in Cortex Analyst
Cortex Analystは自然言語で、snowflakeデータに問い合わせできるアシスタントのような役割を担います。
Streamlit/Notebook/Workspaces
Streamlitについては、AzureとAWSのプライベート接続が可能となります。
またSnowflake Steering Communityといったコミュニティが立ち上がるとの発表もありました。
Notebookについても、AzureとAWS、GCPとのプライベート接続が可能となるようです。
Apache Icebergの対応可能データ型追加
Apache Icebergでは、データ型Geonetry型などサポートされるデータ型が増えるそうです。
Age of AI Inference
Snowflake上で、OpenAIをはじめ様々なモデルが利用可能な状態となっています。
OpenAI Compatible endpointを利用することで、OpenAI SDKを使って、Snowflake CortexのLLM(大規模言語モデル)を簡単に実行できるようになります。
最後に
ついにSnowflake Summitも3日目を終え、最終日を迎えます。
ここまで、現地でしか感じられない熱気、グローバルな参加者との交流、そして次々と発表された新機能の数々に圧倒されながらも、非常に実りある時間を過ごすことができました。Hands-onではSigmaやdbt、各ブースではAtlanやCoalesce、Hevoなどといったこれまで触れてこなかった素晴らしい製品にも出会いました。
帰国後は、今回発表されたCortex AISQLなどの新機能を実際に検証・活用しながら、これまで触れてこなかった製品群にも積極的にチャレンジしていく予定です。
これらの最新技術を活かし、お客様の課題により深く寄り添ったご提案ができるよう、よりスピーディかつ柔軟なデータ活用の実現をサポートしてまいります。
「AI×データ活用」にご興味のある方や、Snowflakeの新機能について相談してみたいという方は、ぜひお気軽にご連絡ください。
谷尾 瑞紀(日本ビジネスシステムズ株式会社)
Data&AI事業本部 ソリューション部 Dataソリューション2グループ所属。 日々の業務で得た知見をもとに、データエンジニアリングを中心に情報を発信しています。SnowflakeやInformatica、Power Automateなどといった一連のデータ基盤構築・自動化の技術に加え、LLM(大規模言語モデル)を活用した業務効率化やデータ利活用の実践例・Tipsも紹介しています。
担当記事一覧