日々更新があるAzureOpenAIですが、6月の更新情報がアップされたのでお知らせしたいと思います。
概要
- 英国南部のリージョン追加(gpt-35-tuboのみ)
- コンテンツフィルタのカスタマイズができるようになった
- クォータ制限が各リソースごとからリージョン全体に変わった
の3点となります。特に影響が大きいのは3つ目のクォータ制限のところになります。順番に紹介します。
英国南部リージョンの追加
英国南部リージョンでもサービスが開始されました。
ドキュメント上は米国東部、米国中南部、フランス中部、西ヨーロッパ、英国南部の5つのリージョンがありますが、2023年6月14日の時点で新規にリソースを作成できるのは米国東部、フランス中部、西ヨーロッパ、英国南部の4つのリージョンになっています。
また、英国南部はgpt-35-turboモデルのみのサポートのようです。
コンテンツフィルタのカスタマイズ
公式ドキュメント
Azure OpenAI Service でコンテンツ フィルター (プレビュー) を使用する方法 - Azure OpenAI | Microsoft Learn
コンテンツフィルタのカスタマイズができるようになりました。デフォルトのコンテンツフィルタは下記のようにそれぞれLowに関する部分は受け付けています。
Azure OpenAI Limited Access Reviewの申請をすればフィルタを外したりMedium、Highをそれぞれ受け付けたりできるようですが、通常の状態ではフィルタをLowにも適用することしかできないようです。
手順
Content filters(Preview)を選択して+Create cutomized content filterを選択する
新しく作るcontent filterの名前を入力する
カスタマイズして保存する
カスタマイズしたフィルタを適用してモデルをデプロイする
この作業でフィルタの適用は完了です。
クォータ制限
公式ドキュメント
Azure OpenAI Service のクォータを管理する - Azure Cognitive Services | Microsoft Learn
クォータ制限が各リソースごとからリージョン全体に適応されるように変更になりました。
以前はリージョンに3つまでリソースをデプロイ出来てgpt-35-turboモデルならそれぞれのリソースで1分間に120,000トークンとなっていましたが、変更後は30までリソースをデプロイできるがリージョン全体で1分間に240,000トークンとなっています。
変更前
変更後
クォータ制限の変更点
変更点を表にすると下記になります。
制限名 | 制限値 |
---|---|
リージョンごとの OpenAI リソース(サブスクリプション単位) |
30 |
リージョン単位でモデルごとの 1 分あたりのトークン数(TPM) | Text-Davinci-003: 120 K GPT-4: 20 K GPT-4-32K: 60 K その他すべてのモデル: 240K |
モデルごとの 1 分あたりの呼び出し回数 | TPMに応じて決まります。レートは6 RPM per 1000 TPMです |
最新情報はこちら
Azure OpenAI Service quotas and limits - Azure Cognitive Services | Microsoft Learn
設定方法
新しいデプロイの作成からモデルのデプロイの画面で詳細オプションを展開するとTokens per Minute Rate Limit (thousands)という項目があるのでこちらで選択してデプロイできます。
すでにデプロイしているモデルはデプロイの編集から変更できます。
デプロイ時と同様に詳細設定オプションから設定できます。
まとめ
リージョンが増えたのは単純にうれしいです。コンテンツフィルタに関してはAzure OpenAI Limited Access Reviewの申請をしないとあまり使うシーンは無いという印象です。
また、クォータ制限に関してはgpt-35-turboモデルであれば今まで全体で360Kトークン使えたところが240Kトークンになってしまったので、実質制限が厳しくなったと考えます。
上田 英治(日本ビジネスシステムズ株式会社)
エンジニアとしてインフラ構築、システム開発やIoT基盤構築等を経験し、現在はクラウドアーキテクトとして先端技術の活用提案や新規サービスの立ち上げを担当。
担当記事一覧