マルチモーダルAI

Azure AI Speech Service+ChatGPTを使って、入出力が音声のみのアシスタントサービスを作成する

Azure AI ServiceのAIとChatGPTを使用した音声チャットボットを構築します。また発声からレスポンスまでのユーザーの待機時間がどの程度になるのかを検証します。

GPT-4 Turbo with Vision: Azure OpenAI Service マルチモーダルな新モデルの概要と使用方法

OpenAI DevDayで発表されたGPT-4のマルチモーダルモデルであるGPT-4 Turbo VisionがAzure OpenAIでもプレビュー機能として使用できるようになりました。今回の記事ではその概要と、簡単な使用方法に触れていきます。

GPT-4VとUnreal Engineの融合:マルチモーダルAIによる仮想空間でのアプリ検証とメタバースの新たな可能性

最新のマルチモーダルAIモデルGPT-4Vの可能性を探るべく、OpenAIのAPIを活用し、Unreal Engine 5.2で構築された3D環境での画像解析能力を検証しました。この記事では、仮想空間内を歩き回りながらリアルタイムで分析結果を取得するプロセスを通じて、AIの視…