JBS Tech Blog

自社のデータを基に回答をさせるRAG（Retrieval Augmented Generation）の仕組み

Azure AI Search Azure AI Azure OpenAI 大規模言語モデル

自社のデータを基に回答をさせるAzure OpenAI Serviceを利用したChatシステムを作る際の最適な方法について、今回はRAG（Retrieval Augmented Generation）の仕組みを中心に解説します。

※ 本記事は、以前にハイブリットクラウド研究会で発表した資料をベースに、ブログ用に再編集したものとなります

アプローチの比較
RAGのアーキテクチャ
RAGの流れ
RAGのプロンプト
まとめ

アプローチの比較

自社のデータを基に回答をさせるAzure OpenAI Serviceベースのチャットシステムを作る際には、大きく分けて以下の2つのアプローチがあると考えています。

データを参照して回答を生成する
モデルに学習させる

データを参照して回答を生成する

RAG（Retrieval Augmented Generation）
- 直訳すると検索拡張生成となる
- 入力プロンプトのキーワードやベクトルからDBを検索して入力プロンプトの回答を生成する
Azure OpenAI Service On Your Data
- 基本的な仕組みはRAGだが、Azure OpenAI ServiceのAPIにAI Searchの検索やクエリのベクトル化などが含まれており、RAGに必要なプロンプトを書く必要はない

モデルに学習させる

Fine-Tuning
- 事前にモデルに自社のデータを学習させる
- レスポンスは良いがコストがかかる

比較表

	RAG	Azure OpenAI Service On Your Data	Fine-tuning
難易度	高自身でデータを検索したり、回答を生成するコードを書く必要がある	中検索や回答の部分は書かなくてもAPIで使える	中学習用データを作る必要があり、どのくらいの量を作ればよいかのノウハウが必要
コスト	中 ApplicationとAI SearchとAzure OpenAI Serviceが必要	中 ApplicationとAI SearchとAzure OpenAI Serviceが必要	高学習と学習済みモデル(インスタンス)の稼働にかなりのコストがかかるトレーニング：¥14,507.971/h ホスティング：¥995.646/h 2024年1月17日 Azure OpenAI Service - 価格 \| Microsoft Azure
ハルシネーション低減の工夫	可プロンプトの工夫で低減できる	不可すでにされていて個別の工夫は難しい	可学習量次第だがかなりのコストがかかる

RAGのアーキテクチャ

こちらは閉域網を想定していますが。ExpressRouteを使わない構成も可能です。

Microsoft社のAzure OpenAI Service リファレンスアーキテクチャにも掲載していますのでそちらもご覧ください。

Azure OpenAI Service リファレンスアーキテクチャ

RAGの流れ

利用者からの「JBSの売上は？」という質問に対して、あらかじめAI Searchに格納されているドキュメントから回答する、というシナリオで流れを解説します。

利用者が「JBSの売上は？」という質問をフロントからFunctionに対して送信
Functionは質問をAzure OpenAI Serviceに対してキーワード抽出とベクトル化を実施
Azure OpenAI Serviceから返ってきたキーワードとベクトルでAI Searchに対して該当コンテンツを検索
AI Searchから返ってきたコンテンツと最初の質問をAzure OpenAI Serviceへ送信して適切な回答をユーザーへ返す

RAGのプロンプト

重要になるプロンプトはキーワードと回答生成になります。

特に回答生成の部分で”出典にないことは回答しないでください”などこの部分を強く書いたり、ロールを指定したりすることで、ハルシネーションの低減につながると考えます。

まとめ

RAGとAzure OpenAI Service On Your Dataとの違いですが、プロンプトの修正やチャンクサイズやオーバーラップの調整、日本語への対応などがブラックボックスになっています。

それに対して、自身でRAGの仕組みを構築すると、カスタマイズが可能になるのでより精度が高い仕組みを作る事が出来ると考えます。

また、RAGを構築するうえで、プロンプトや日本語やファイルの種類によって、最適なチャンクサイズや引用の見せ方など、考慮することはたくさんありますのでそれぞれの企業で工夫が必要となります。

Big Smile, Big Future エンジニア積極採用中　募集要項はこちら！

About

JBS Tech Blogは、日本ビジネスシステムズ（JBS）の社員が分担して執筆を担当し、技術情報を発信しているブログです！

RSSで購読する

APIを利用してMicrosoft Cost Managementのサブスクリプション一覧を取得する方法 -第一部-
APIを利用してCost Managementのサブスクリプションの一覧を取得する方法についてま…
Excelで行や列を非表示にしていた場合のPower Automateへの影響
Excelを使ったPower Automateを利用する際、Excelで行や列を非表示にした時にフロー…
効率化を目指すExcelドキュメントの自動成型
Power Automate Desktop を使用したExcel操作を紹介します。
【Microsoft Lists】参照列の使い方
Microsoft Listsでは、参照列を使用して複数のListsを組み合わせたテーブル構成がで…
Azure OpenAI Studio でリスクと安全性の監視
3月に発表された新機能でAzure OpenAI Studioでリスクと安全性の監視という機能が追…
AWS Systems Manager インベントリの概要
AWSのSystems Manager インベントリの概要と設定方法について紹介します。
syslog ログローテーション設定 ( maxage設定 )
syslogを利用する際は、肥大化するログをどのタイミングでローテーションし、どれく…

もっと見る

カテゴリー

月別アーカイブ