この記事は 【Microsoft×生成AI連載】週次連載開催! の連載記事です。
【Microsoft×生成AI連載】今回はMicrosoft 365 Copilotのリサーチツールに追加された「モデル会議」機能を使用します。
これまでは、GPTなど1つのAIモデルで調査を行うのが一般的でしたが、モデル会議を使用することで、GPTとClaudeを同時に活用するとどのような結果が得られるのかを検証してみます。
Microsoft 365 Copilotに興味がある方、普段から利用されている方などさまざまな方に読んでいただきたい記事となっておりますので、ぜひご覧ください。
※この記事の情報は2026/4/14時点のものです。
- これまでの連載
- リサーチツール(Researcher)とは
- マルチモデル・インテリジェンスの概要
- 前提条件
- 実際に使ってみた
- 利用シーンとメリット、注意点
- まとめ
- おまけ(Copilotによる本記事の要約)
これまでの連載
これまでの連載記事一覧はこちらの記事にまとめておりますので、過去の連載を確認されたい方はこちらの記載をご参照ください。
リサーチツール(Researcher)とは
リサーチツール(英語名:Researcher)は、Microsoft 365 Copilot(以下、Copilot)に搭載されている深層調査エージェントです。2025年3月に発表され、同年6月に一般提供(General Availability)が開始されました。
ユーザーが調査テーマを入力すると、リサーチツールが以下のデータソースを横断して自律的に情報を収集・分析し、出典リンク付きの構造化レポートを生成します。
- Webの公開情報
- 社内コンテンツ(ファイル、メール、会議メモ、Teamsチャット)
- 外部コネクタ経由のサードパーティデータ(Salesforce、ServiceNow、Confluenceなど)
従来、リサーチツールはOpenAIのGPTモデル(以下、GPT)のみで動作していました。2026年3月30日のアップデートにより、AnthropicのClaudeモデル(以下、Claude)を組み合わせた「マルチモデル・インテリジェンス」が導入されています。
マルチモデル・インテリジェンスの概要
マルチモデル・インテリジェンスとは、リサーチツール内部で複数のAIモデルを連携させ、調査結果の精度と信頼性を向上させる仕組みです。
リサーチツールの操作画面にはモデルピッカーがあり、ここで調査の方式を選択します。

選択肢は以下の2つです。
| モデルピッカーの選択肢 | 対応するモード | 動作方式 |
|---|---|---|
| 自動(デフォルト) | Critique(クリティーク) | GPTがレポートを生成し、Claudeが査読する逐次処理 |
| Model Council | Council(カウンシル)。日本語では「モデル会議」とも呼ばれる | GPTとClaudeが独立にレポートを作成し、第三のモデルが統合する並列処理 |
以降、それぞれのモードの仕組みを解説します。
Critiqueモードの仕組み
Critiqueは「生成と評価の分離」をコンセプトとした逐次型の処理方式です。モデルピッカーで[自動]を選択した場合に適用されます。
処理は以下の順に進みます。
- ユーザーが調査テーマ(リサーチクエリ)を入力する
- リサーチツールがGPTを用いてWeb検索と情報収集を行い、調査レポートの初稿を生成する
- 生成された初稿をClaudeが以下の3つの観点から査読する
- ソースの信頼性評価 ― 引用元の権威性や正確性を検証する
- レポートの網羅性確認 ― 重要な論点が漏れていないかチェックする
- 証拠に基づく記述の厳格性確保 ― 主張が適切な根拠に裏付けられているか検証する
- 査読結果を反映した精緻化済みレポートがユーザーに提供される
以下の図は、Critiqueモードの処理フローです。

Councilモードの仕組み(モデル会議)
Council(カウンシル)は、複数のAIモデルが「会議」のように独立した意見を出し合い、それを第三者が取りまとめる並列型の処理方式です。モデルピッカーで[Model Council]を選択した場合に適用されます。
処理は以下の順に進みます。
- ユーザーが調査テーマ(リサーチクエリ)を入力する
- GPTとClaudeがそれぞれ独立して並列にリサーチを実行し、個別のレポートを作成する
- 2つのレポートを受け取った第三のAIモデル(ジャッジモデルと呼ばれる、提供元・モデル名は非公開)が、以下の観点で統合サマリーを生成する
- 両モデルが合意した点 ― 信頼性の高い情報として強調される
- 両モデルが相違した点 ― 異なる視点や解釈として明示される
- 各モデルが独自に補足した視点 ― 片方のモデルだけが拾った情報が記載される
以下の図は、Councilモード(モデル会議)の処理フローです。

前提条件
マルチモデル・インテリジェンスを利用するには、2026年4月時点で以下の条件を満たす必要があります。
- ライセンス ― Microsoft 365 Copilotライセンス($30/ユーザー/月)またはMicrosoft 365 Premium
- 早期アクセスへの登録 ― Microsoft Frontierプログラム(以下、Frontierプログラム)への組織単位での申し込みが必要。Frontierプログラムとは、Microsoftが提供する早期アクセスチャネルで、新機能を一般展開前に利用できる
- 管理者設定 ― 組織のMicrosoft 365管理センターで、Anthropicをデータ処理の委託先(サブプロセッサ)として有効化する
- 利用上限 ― リサーチツールとAnalyst(Copilotに搭載されているもう1つの分析エージェント)の合算で、月25クエリ/ユーザー
この機能は段階的に展開されている途中であり、Frontierプログラムに登録していないテナントでは利用できない場合があります。
実際に使ってみた
ここからは、リサーチツールのマルチモデル・インテリジェンス機能を実際に操作した様子をご紹介します。
準備:リサーチツールへのアクセス
Microsoft 365 Copilotアプリにアクセスし、左サイドバーの[エージェント]から[リサーチ ツール]を選択します。画面上部にモデルピッカーが表示され、「自動:GPT が応答し、Claude が改善します (Frontier)。」と表示されています。

モデルピッカーを開くと、以下の4つの選択肢が表示されます。

Critiqueモードを試す
モデルピッカーで[自動]が選択されていることを確認し、調査テーマを入力します。今回は「Microsoft 365 Copilotの導入効果に関する最新調査データをまとめてください」というテーマで試しました。
リサーチが開始されると、GPTによる調査が進行する様子が表示されます。

数分後にレポートが完成しました。画面上部に「推論が 80 ステップで完了しました」と表示され、その下に「生成モデル GPT・絞り込みモデル Claude」と役割分担が明記されています。

Critiqueモードの最終レポートです。引用元のリンクが付与されており、ソースの信頼性をユーザー自身でも確認できるようになっています。

Councilモード(モデル会議)を試す
次に、モデルピッカーを[Model Council]に切り替え、同じテーマで調査を行います。説明文が「GPT と Claude の両方が応答を生成します (Frontier)。」に変わります。

Councilモードでは、GPTとClaudeが並列でリサーチを実行します。画面上にGPTとClaudeの2つのカードが横並びで表示され、それぞれが同時に調査を進めている様子を確認できます。

最終的に、両方のレポートが完成し、その下にジャッジモデルによる統合サマリーが出力されます。

2つのモードを比較して
同じテーマで両モードを試した結果、以下の違いが感じられました。
- Critiqueモード ― 一貫性のある整った文章で、引用の品質が高い印象。1つの完成度の高いレポートを求める場面に向いている
- Councilモード ― 同じ事実でもモデルによって異なる切り口で分析されており、見落としがちな視点に気づきやすい。比較検討が必要な場面に向いている
業務での使い分けとしては、定型的な調査報告にはCritiqueモード、戦略検討や意思決定の材料にはCouncilモードが適していると感じました。
利用シーンとメリット、注意点
利用シーン
| シーン | 推奨モード | 理由 |
|---|---|---|
| 技術調査・ファクトチェック | Critique(自動) | 査読によるソース品質の向上が有効 |
| 競合分析・市場調査 | Council(Model Council) | 異なる切り口の比較で見落としを防ぐ |
| 経営層向けレポート作成 | Critique(自動) | 一貫性のある高品質な単一レポートが得られる |
| 新規事業の方向性検討 | Council(Model Council) | 多角的な視点で仮説の幅を広げられる |
| 社内ナレッジの横断調査 | Critique(自動) | 社内データとWebを統合した正確な調査が可能 |
メリット
マルチモデル・インテリジェンスを活用することで、以下のようなメリットが期待できます。
- 調査精度の向上 ― Microsoftが公開しているDRACOベンチマーク(Deep Research Automated Comprehensive evaluation)では、単体モデル比 +13.88% の精度向上が報告されている
- ハルシネーションの低減 ― Critiqueモードでは査読、Councilモードでは比較照合により、事実と異なる出力のリスクが軽減される
- 多角的な視点の取得 ― Councilモードでは、GPTとClaudeの異なる分析視点を1つの調査で同時に得られる
- Copilot内で完結 ― 別途Claude.aiやChatGPTにアクセスする必要がなく、Microsoft 365の権限・コンプライアンスポリシー内で利用できる
注意点
- 展開状況 ― 2026年4月時点では、Frontierプログラムへの登録が必要です。一般のCopilotライセンスのみでは利用できない場合があります
- セッション管理 ― Claudeへのアクセスはセッション単位で管理されており、アプリを閉じるとモデルピッカーがデフォルト(自動)に戻ります
- 情報の信頼性 ― 複数モデルを使用していても、調査対象はWeb上の公開情報が中心です。重要な事実は一次情報で確認することをお勧めします
- Critiqueモードの方向 ― 現時点では、GPTが生成しClaudeが査読する一方向のみです。逆方向には対応していません
- 対応モデル ― 現時点ではGPTとClaudeの2モデル構成です。Google Geminiなど他社モデルの参加は発表されていません
まとめ
今回は、Microsoft 365 Copilotのリサーチツールに追加されたマルチモデル・インテリジェンス機能をご紹介しました。
GPTとClaudeという異なる特性を持つAIモデルを組み合わせることで、単体では実現が難しかった精度と多角的な視点の両立が可能になっています。Critiqueモードは品質重視の調査に、Councilモード(モデル会議)は多角的な比較検討に、それぞれ強みを発揮します。
現時点ではFrontierプログラムへの登録が必要ですが、今後の一般展開が見込まれる機能です。リサーチ業務の品質向上に関心のある方は、管理者への早期申請をご検討ください。
おまけ(Copilotによる本記事の要約)
本記事ここまでの執筆内容をCopilot Chatに転記し、記事内容の要約をしてもらいました。
この記事では、Microsoft 365 Copilotのリサーチツールに追加されたマルチモデル・インテリジェンス機能を実際に試し、その効果を検証しています。GPTとClaudeという異なる強みを持つ生成AIを組み合わせることで、単体モデルでは得られない調査精度と信頼性の向上が期待できる点がポイントです。
- GPTが生成し、Claudeが査読する「Critiqueモード」による逐次的な品質向上の仕組み
- GPTとClaudeが並列に調査し、結果を統合する「Councilモード(モデル会議)」の特徴
- DRACOベンチマークで示された、単体モデル比13.88%の精度向上という客観的効果
- 利用に必要なライセンス条件とFrontierプログラムの位置づけ
- 実際の操作画面と、使ってみて分かった両モードの所感と使い分けの示唆
(出典:Microsoft 365 Copilot による本記事の要約)
松本 孝祐(日本ビジネスシステムズ株式会社)
Microsoft 365を中心に、Copilotの活用支援を担当。 合計4000人を超える受講者にCopilotを活用した業務効率化のコツを伝えています。 Copilotは使い方次第であなたの強力なパートナーになります、一緒にコパりましょう!
担当記事一覧