Azure OpenAI on your own data(preview)にベクトル検索とセマンティック検索が追加されて日本語の精度が上昇

Azure OpenAI on your own dataにいくつかの機能追加がありました。

ベクトル検索とセマンティック検索が追加されたことによって日本語の精度が向上していますので、この記事ではベクトル検索とセマンティック検索の追加機能を中心にご紹介いたします。

Azure OpenAI on your own dataのおさらい
Azure OpenAI on your own dataの追加機能
- ベクトル検索とは
- セマンティック検索
デプロイ
検索のテスト
Webアプリのデプロイ
検索比較
まとめ

Azure OpenAI on your own dataのおさらい

Azure OpenAI on your own dataを使うと、簡単に社内のデータなど独自のデータを基に回答する、チャットアプリを構築することができます。

詳細はこちらの記事もご参照ください。

blog.jbs.co.jp

当初、ベクトル検索やセマンティック検索の日本語がサポートされていなかったので、日本語ベースのドキュメントでは精度が良くないことがありましたが、これらの機能が追加されたことによって日本語での精度向上が期待できます。

Azure OpenAI on your own dataの追加機能

ベクトル検索やセマンティック検索の他にも機能追加がありましたので、以下に紹介します。（2023年9月13日現在）

ベクトル検索とセマンティック検索の追加
- 従来、日本語の検索精度はあまりよくありませんでしたが、これらの機能を使用することによって日本語の検索精度の改善が期待できます。
プライベートエンドポイントのサポート
- OpenAIおよびAzure Cognitive Searchを仮想ネットワーク内に閉じて利用することができます。（ただしAzure OpenAI Studioはサポートされていないため、API利用のみになります）
ドキュメントのアクセス制限
- Azure Cognitive Searchのセキュリティフィルタとセキュリティフィルタを組み合わせることによって、検索するドキュメントへのアクセス制御が可能になります。
Power Virtual Agentsでのデプロイが追加
- Azure OpenAI Studioからアプリケーションをデプロイする際に、Power Virtual Agentsでのデプロイも追加されました。
インデクサーのスケジュール
- 従来、Azure OpenAI StudioからAzure Blob Storageのドキュメントをソースにしてインデックスを作る際に、インデクサーが消えてしまってBlob にファイルが追加されても反映されなかったのですが、インデクサーをスケジュールすることによってファイル追加が可能になります。
チャット履歴の保持
- Azure OpenAI StudioからWebアプリをデプロイする際に、Azure Cosmos DBのオプションを指定することによって、チャットの履歴を保存することができるようになりました。