Snowflake Summit 2024 Day 2 現地レポート

日本ビジネスシステムズでデータエンジニアをしてる土井です。

昨日レポート記事を書いた岩間と共に、私もサンフランシスコで行われるData Cloud Summit 2024に現地参加しております。

本日も現地からイベントの様子をお伝えしていきたいと思います。

※昨日のレポート記事はこちらです。

Snowflake Summit 2024 Day 1 現地レポート - JBS Tech Blog

キーノート「Platform Keynote」

Day 2最初の講演はPlatform Keynoteでした。

正直なところ、このセッションだけで何記事か書けそうなぐらいに充実した濃い内容でしたので、本記事では当該セッションの内容をメインに扱います。

発表された内容は以下の通りです。

AI系の機能

  • Cortex Studio
  • Cortex Analytics
    • チャットボットの構築プロセスを簡素化するための機能
  • Cortex fine tuning
    • SQL関数を通じてファインチューニングが行える機能
    • 現在Public Preview中
  • Cortex Search
    • RAGのインデックス構築のための機能
    • 間もなくPublic Preview
  • Snowflake Copilot
  • Document AI
    • General Available

開発系機能

  • Snowflake Notebooks
    • Snowflake上でJupyter NotebookやDatabricksのようなNotebookを利用できる機能、デモ画面上ではContainer上で動く様子も
    • 現在Public Preview中
  • Native Apps with Snowpark Container Services
    • 構築したコンテナサービスをNative Appsを通じて配布できる機能
  • Snowpark Pandas API
  • Iceberg Tables
    • Snowflake上で作成できるオープンソースのテーブルフォーマット
    • 今回新たにMicrosoft FabricのOneLakeを外部ボリュームとしてSnowflake Iceberg Tableが構築できるように
  • Polaris Catalog
    • Iceberg用のメタデータカタログのSnowflakeマネージド実装
  • Dynamic Tables
    • General Available
  • Serverless Tasks Flex
    • コスト最適化されたサーバーレスタスクの実行オプション
    • 余っているコンピュートリソースを使うことでコストを最大42%抑えてタスクの実行が可能

運用/ガバナンス系機能

  • Trust Center
    • Snowflakeアカウントのセキュリティ系の設定などを監視し、脆弱性診断を実施してくれる機能
    • General Available
  • Snowflake Trail
  • Database Change Management

その他

  • ダークモード
    • Snowsightでダークモードが利用できるように

所感

今年も非常にたくさんの新機能やアップデートが発表されましたが、やはりメイントピックはSnowflakeのAI開発機能である「Cortex」に関する内容でした。

Cortex Analyticsのライブデモでは、Snowflakeのコンソールに数回しか触れたことのないユーザーを壇上に招き、わずか数分でチャットボットを作成する様子も確認できました。

ファインチューニングやRAG構築など、AIのユースケースを洗練化するための機能群も続々と発表され、よりAIのためのデータプラットフォームとしてのSnowflakeのプレゼンスが高まったように感じました。

個人的に興味深かったのがIceberg TablesのOneLakeサポートです。

本機能については、先月行われたMicrosoft側の年次イベントである「Build」でも同様の内容が発表されていました。

この機能により、Snowflake、Microsoft Fabricでそれぞれデータコピーを持つのではなく、双方から同じデータにアクセスすることが可能となるため、相互に様々なコラボレーションユースケースが生まれることが期待できます。

また、Snowflake NotebooksもSnowflakeユーザーにとっては非常に関心の高い発表だったのではないかと思います。

こういった開発者体験に関わる部分の機能は、データプラットフォームとしてしばしば比較に上がるDatabricksが先行していたイメージが強かったですが、今回の発表でそういった部分を重視するユーザーに対して新たな選択肢を提供するものになったのではないでしょうか。

おわりに

Day 2 Keynoteセッションの内容をまとめてみました。

昨年はContainer ServicesやNative Apps、Document AIといった、データプラットフォームとしてのユースケースの広がりに比重を置いた内容の印象でしたが、今年はそれらを更に充足・高度化するための機能の発表が多かったのではないかと思います。

他にも様々なセッションに参加していたので本来はそちらも記事にしようと思っていたのですが、メモも追いつかないほどの発表ラッシュだったため、Keynote部分にフォーカスした内容とさせていただきました。

明日以降も即日公開でレポート記事を投稿していきますので、よろしければご覧ください。

執筆担当者プロフィール
土井 龍史

土井 龍史

Hadoopインフラ畑出身のデータエンジニア。主にAzure/AWSのデータ基盤開発を担当しています。最近はデータベース技術全般やデータモデリングに関心があります。

担当記事一覧