先日OpenAIから発表されたGPT-4oですが、現在はプレイグラウンド内でのみ利用可能ですが、Azureでもテストすることができますので、その紹介をさせていただきます。
概要
日本時間2024/5/14未明にOpenAI社からGPT-4oが発表されました。
https://openai.com/index/hello-gpt-4o/
GPT-4oは活発な会話のスキルがあり、写真や図表などの画像の理解力が高まったとあります。
Microsoftからの発表では以下の通り、テキストとビジョンの入力に焦点を当ててリリースされています。
良くなったところ
- 速度とコストの向上
- 英語以外の画像分析の向上
特にGPT-4oはGPT-4 Turboに比べて英語以外の言語の画像分析能力が向上したようですので、日本語の利用に関しては期待できると考えます。また、速度と効率を重視して設計されているそうなので、パフォーマンス面でも期待できそうです。
GPT-4o は OpenAI の最新プレビュー モデルです。 GPT-4o はテキストと画像を 1 つのモデルに統合し、複数のデータ型を同時に処理できるようにします。このマルチモーダルなアプローチにより、人間とコンピューターの対話における精度と応答性が向上します。 GPT-4o は、英語のテキストやコーディング タスクでは GPT-4 Turbo に匹敵する一方、英語以外の言語やビジョン タスクでは優れたパフォーマンスを提供し、AI 機能の新しいベンチマークを設定します。
Azure OpenAI Service models - Azure OpenAI | Microsoft Learn
Azureの現時点(2024/5/14)での制限事項
- Azure OpenAI Studio Early Access Playground (プレビュー)でのみ利用可能
- 利用可能なリージョンはWest US3とEast USのみ
- サブスクリプションごとに5分間で10リクエストまで
Azureでの利用にはまだ制限があり、現在は開発者用としてプレイグラウンドで利用できるのみです。APIとしてシステムからは使えません。
Azure OpenAI Service models - Azure OpenAI | Microsoft Learn
プレイグラウンドでの使い方
Azure OpenAI Studioにアクセスします。
対象のリージョンにアクセスすると「Early access playground」が表示されますので、これを選択します。
プレイグラウンドにアクセスすると、モデルの選択肢として「gpt-4o preview」が表示され、他のモデルは選択できません。
レインボーブリッジの写真を送ってみたところ、「レインボーブリッジ」と正確に教えてくれました。
GPT-4 Turboとの比較
英語以外の画像分析が向上したとのことですので弊社のIR資料で試してみます。
使うページは財務のハイライトのページです。
GPT-4 TurboとGPT-4oに以下のプロンプトを送信し、それぞれの回答を比較します。
GPT-4 Turboの回答
先月GAされた最新のモデル(turbo-2024-04-09)を使っています。30秒ほどで以下の回答になりました。グラフに関しては正確ですが、誤って「日本ビジネスレポート株式会社」と認識してしまいました。
回答までの時間:30秒
GPT-4oの回答
15秒で以下の回答があり、「日本ビジネスシステムズ株式会社」と正確に読み取ることができ、日本語の精度が向上していることが確認できました。
回答までの時間:15秒
まとめ
案内通り、日本語の読み取り精度が向上していることが確認できました。
現在はプレイグラウンドでしか利用できないため、モデルのデプロイやAPIを通じた利用はまだできませんが、特に日本語の処理において大きな期待が持てます。
また、テスト結果からはレスポンスタイムが短縮されていることも分かり、速さについても期待できると考えられます。
上田 英治(日本ビジネスシステムズ株式会社)
エンジニアとしてインフラ構築、システム開発やIoT基盤構築等を経験し、現在はクラウドアーキテクトとして先端技術の活用提案や新規サービスの立ち上げを担当。
担当記事一覧