マルチモーダルAI
Azure Cognitive Services
Azure Document Intelligence
Azure OpenAI
GPT-4o
GPT-4 Turbo with Vision
マルチモーダルAI
大規模言語モデル
本記事では、新しくリリースされたGPT-4o、GA版がリリースされたGPT-4 Turbo with Vision、およびAzure AI Document Intelligenceを使用した日本語文書のOCR性能を比較検証しています。AIモデルを通じた画像からの文字抽出テストを行い、文字一致率の計算方…
Azure AI ServiceのAIとChatGPTを使用した音声チャットボットを構築します。また発声からレスポンスまでのユーザーの待機時間がどの程度になるのかを検証します。
OpenAI DevDayで発表されたGPT-4のマルチモーダルモデルであるGPT-4 Turbo VisionがAzure OpenAIでもプレビュー機能として使用できるようになりました。今回の記事ではその概要と、簡単な使用方法に触れていきます。
最新のマルチモーダルAIモデルGPT-4Vの可能性を探るべく、OpenAIのAPIを活用し、Unreal Engine 5.2で構築された3D環境での画像解析能力を検証しました。この記事では、仮想空間内を歩き回りながらリアルタイムで分析結果を取得するプロセスを通じて、AIの視…