すべての人のための AI コンパニオン~Copilot Voice!Copilot Vision!~

突然Microsoftから発表されましたが、今後Copilotがまた進化します!速報的にその紹介です。

blogs.microsoft.com

発表概要

以下の機能の発表がされました。

  • 新機能
    • Copilot Voice
    • Copilot Daily
    • Personalized Discover
  • 開発中の実験的な機能
    • Copilot Vision
    • Think Deeper

ただし、残念ながらまだ日本ではしばらく使えません。米国と英国を中心に複数カ国で展開開始されます。*1

新機能

Copilot Voice

www.youtube.com

これは、最近ChatGPTで利用開始された高度な音声モードと同じようなものと考えるとわかりやすいですね。

動画で触れられていた内容を、イメージが付きやすいように整理してご紹介します。

1. 日常的な状況と質問の発生

発話者は友人宅の引っ越し祝いに向かう途中、スーパーにいる状況で、自分の定番であるワインが友人に適していないことを思い出します。

そして、代わりのプレゼントを探している、という質問を投げかけます。

2. 代替のプレゼント提案

 ワインの代わりとして「多用途な」プレゼントの提案が行われます。

例えば、職人が作ったお茶のセット、高品質のオリーブオイル、またはお菓子やスナックが入ったグルメギフトバスケットが提案されます。

3. 提案に対する疑問への回答

「なぜ人々が高級オリーブオイルを求めるのか」という疑問に対し、風味や品質が高く、料理やサラダを格上げする効果があると説明されています。

高級ワインと同じ理由で選ばれる、という点も強調されています。

4. 提案されたプレゼントの選び方への回答

「どのように高級オリーブオイルを見分けるか」という質問に対して、エクストラバージンオリーブオイルを選ぶことが推奨されています。

冷却圧搾されていること、産地(イタリア、ギリシャ、スペインなど)が明記されていること、または使用されているオリーブの品種が表示されていることが重要だと説明されています。

5. 提案されたプレゼントに対する詳細情報の回答

「最も高級なオリーブオイルの産地はどこか」という質問に対し、現在のトレンドとしてイタリアのオリーブオイルが人気で、特にトスカーナ産が「ペッパーのような辛味」が特徴のものとして推奨されていることが説明されています。

Copilot Daily

ニュースや天気の要約を、Copilot Voiceの機能を利用して音声で提供してくれます。

音声アシスタントは、Google HomeやAlexa等をイメージすればわかりやすいと思います。

Copilot Voiceが利用できるということは、ニュースの不明点があればそのまま質問して回答をもらう、といったことができるのではないかと想像できます。

Personalized Discover

www.youtube.com

他のMicrosoft製品の利用状況や会話履歴をもとに、おすすめの情報を見やすい形式で提案してくれる機能のようです。

開発中の実験的な機能

Copilot Vision

www.youtube.com

こちらは画像やテキスト、Webページ等の画面上に見えているものを通じてCopilotと対話が可能な機能となります。実際に動画のやり取りを見てみましょう。

1. Copilotと個人的な思い出の共有

会話の冒頭では、登場人物がCopilotと一緒に思い出の写真を見ながら会話を進めています。

彼の妹が送ってくれた古い写真の中に、彼の祖母の写真があります。この写真を見て、Copilotは「おしゃれな女性だね」とコメントし、さらに「どんな思い出があるの?」と質問します。

2. 祖母の特別なレシピの紹介

登場人物が祖母のレシピについて語ります。

特に「パナカン」と呼ばれる、ドイツ風パンケーキが紹介されています。

3. レシピの調理時間や手順の詳細説明

料理の時間や手順について、Copilotは具体的な情報を提供しています。

リンゴを調理するのに20分、バッター(生地)の準備と組み立てに10分、焼き時間に20~30分、合計で約1時間ほどかかるとされています。

4. 対話の自然な流れとCopilotの役割

Copilotは自然な会話の流れを保ちながら、質問を投げかけ、話を進めていきます。

特に「どうだった?」「試してみたい?」などの質問で、ユーザーの興味を引き出しています。

5. 日常的な会話でのCopilotのサポート機能

最終的に「試してみたらどうだったか教えて」といったように、Copilotはユーザーに対してアクションを促し、その後のフィードバックを求める形で会話を締めくくります。

また、大事な安全性、セキュリティ面についても以下のような内容で言及されています。

  • セッションの安全性
    • Copilot Visionはオプトインで、セッション終了後にデータは破棄され、保存やトレーニングには使用されない
  • Webサイト制限
    • 特定の人気Webサイトに限定して機能し、すべてのWebサイトで使用できるわけではない
  • 有料・センシティブコンテンツ
    •  有料コンテンツやセンシティブなコンテンツではCopilot Visionは機能しない
  • データの扱い
    • 閲覧しているWebサイトのコンテンツはトレーニングに使われず、ユーザーと共に解釈するだけ
  • ユーザーフィードバック
    • 初期ユーザーからのフィードバックを基に、安全対策を強化し、プライバシー保護を重視

Think Deeper

こちらは、OpenAI社が発表してからすぐAzure OpenAI Serviceでも利用可能になっていた、o1シリーズモデルを利用していると想定されます。

より複雑な質問を推論できるようになるので、難しい質問にも答えられるようになります。

news.microsoft.com

最後に

AIコンパニオンという用語を使用するようになってきましたね。より人に寄り添うイメージを伝えるための言葉なのでしょうか。

発表が次から次へと来ているので、ワクワクすると同時に、追いつくのに精一杯ですですが、日々色々な情報は追っていきたいと思いますので、引き続きよろしくお願いいたします!

執筆担当者プロフィール
堤 裕一

堤 裕一

Microsoft 365をメインに活動。FY23 Microsoft Top Partner Engineer Award - Modern Work受賞。今はCopilotにわくわく。

担当記事一覧