Azure OpenAIがついに東日本リージョンで使えるようになりました。
東日本リージョンを使うメリットと2023年8月14日現在で東日本リージョンで使えるモデルの種類と、東日本リージョンのAzure OpenAI更新のタイムラインをご紹介します
東日本リージョンを使うメリット
監査のログが国内に保管される
まずは何と言っても監査のログを含めて国内だけにデータがたまることが最大のメリットかと考えます。
個人データなどの国外移転が難しいケースがありましたが、東日本リージョンを利用することで上記のようなケースにも対応することが可能です。
また以前ブログでAzure OpenAI以外のリソースを東日本に作成する構成をご紹介しましたが、よりシンプルな構成ができるようになりました。
以前の記事でご紹介した構成図は以下でした。
東日本でサービスが開始されたので、現在はシンプルに以下のような構成にすることが可能です。
NW速度の改善
Microsoftが公表している東日本ー米国東部のリージョン間のレイテンシは156msです。
東日本リージョンに集約することでこのレイテンシの改善も期待できます。
東日本リージョンで利用可能なモデル
2023年8月14日現在で東日本リージョンで使えるモデルをまとめました。
モデル名 | MaxRequest(tokens) | Training Data(up to) |
---|---|---|
gpt-4(0613) | 8,192 | 2021/9 |
gpt-4-32k(0613) | 32,768 | 2021/9 |
gpt-35-tubo(0613) | 4,096 | 2021/9 |
gpt-35-tubo-16k(0613) | 16,384 | 2021/9 |
text-embedding-ada-002 (version 2) | 8,191 | 2021/9 |
古いモデル(0301や0314など)や画像生成のDALL-Eは利用できませんが、最新のGPT3.5、GPT-4や埋め込みのモデルは東日本リージョンですべて賄えるようになっています。
東日本リージョン更新のタイムライン
最後に私が把握している範囲の更新履歴をまとめます。(公式ではないです)
日付 | 内容 |
---|---|
2023/7/12 | Microsoftの公式発表はないが東日本リージョンにリソースがデプロイできる状態になった。ただしすぐにリソースのデプロイは出来るがモデルのデプロイは出来ない状態となり事実上利用できない状態 |
2023/7/17 | 東日本リージョンで gpt-35-turbo(0613)とgpt-35-turbo-16k(0613)がモデルデプロイできる状態となり、事実上利用可能になるがMicrosoftのドキュメントに東日本ンリージョンの記載ない状態 |
2023/7/24 |
MicrosoftのModelsのgpt-35-turbo(0613)とgpt-35-turbo-16k(0613)のページに東日本リージョンが記載される |
2023/8/2 | GPT-4の利用可能メールが届き始めてgpt-4(0613)、gpt-4-32k(0613)とtext-embedding-ada-002 (version 2)利用可能になる |
2023/8/3 | MicrosoftのModelsのgpt-4(0613)、gpt-4-32k(0613)とtext-embedding-ada-002 (version 2)のページに東日本リージョンが記載される |
まとめ
GPT-4のサービスが始まったことにより、GPT-4利用承認がかなり下りているようです。
GPT-4をはじめベクトル検索のためのEmbeddingも利用できるので、やっと日本で完結するGPTの利用が始まったと考えています。
今までAzure OpenAIサービスをリージョンが原因で利用できなかったケースはこれを機に利用の再検討してみてはいかがでしょうか。
上田 英治(日本ビジネスシステムズ株式会社)
エンジニアとしてインフラ構築、システム開発やIoT基盤構築等を経験し、現在はクラウドアーキテクトとして先端技術の活用提案や新規サービスの立ち上げを担当。
担当記事一覧